企尚网络论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

查看: 265|回复: 0

php 正则表达式 抓取淘宝商品信息

[复制链接]

182

主题

237

帖子

2743

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
2743
发表于 2019-5-27 16:45:51 | 显示全部楼层 |阅读模式
  1. <form method="post" action="?a=grab">
  2.                 <label>请输入淘宝商品网址:</label>
  3.                 <input type="text" name="taobao_url">
  4.                 <input type="submit" name="submit" value="确定" />
  5.         </form>
复制代码
  1. <?php
  2.                 if(isset($_POST['submit']) && $_POST['taobao_url'] != ''){
  3.                         $url  = $_POST['taobao_url'];

  4.                         $ch = curl_init();
  5.                         curl_setopt($ch, CURLOPT_URL, $url);
  6.                         curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
  7.                         curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 10);
  8.                         curl_setopt($ch, CURLOPT_FOLLOWLOCATION, 1);
  9.                         $html = curl_exec($ch);
  10.                         curl_close($ch);
  11.                         $html = mb_convert_encoding($html, 'utf-8', 'GBK,UTF-8,ASCII');


  12.                         //echo "<textarea style='width:800px;height:600px;'>".$html."</textarea>";

  13.                         preg_match('/<title>([^<>]*)<\/title>/', $html, $title);

  14.                         preg_match('/<strong[^i]*id=\"J_StrPrice\"[^>]*>(.+)<\/strong>/', $html, $price);

  15.                         preg_match('/<(ul)[^c]*class=\"attributes-list\"[^>]*>.*<\/\\1>/is', $html, $attributes);

  16.                         //var_dump($attributes);

  17.         ?>
复制代码

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|小黑屋|手机版|Archiver|企尚网络论坛 ( 陕ICP备15000158号-1

GMT+8, 2019-11-20 09:52 , Processed in 0.083499 second(s), 26 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表