c32's blog
每天学习一点点,每天进步一点点.
-
Php正则爬虫
2015-06-08 16:22:00 | 分类: Php | 标签: 无 阅读(2508) 评论(0) //如果出现中文乱码使用下面代码
//$getcontent = iconv("gb2312", "utf-8",$contents);
<?php
$url = 'http://sintegrate.tmall.com/category-939626514.htm'; //这儿填页面地址
$info=file_get_contents($url);
preg_match('|<p class="price">¥<span>(.*?)<\/span><\/p>|i',$info,$m);
echo $m[1];
?>
<?php
$url = 'http://www.baidu.com'; //这儿填页面地址
$info=file_get_contents($url);
preg_match('|<title>(.*?)<\/title>|i',$info,$m);
echo $m[1];
?>