PHP之phpQuery爬虫

Stephen 后端开发 2019-03-14 18:09:28

用phpQuery简单实现网页内容爬虫

安装方法:

composer require jaeger/querylist

用法:

$phpQuery = \phpQuery::newDocumentFile($url);
$result = \phpQuery::pq('.art_content', $phpQuery);//.art_content 节点
$string = $result->text();//节点文本内容
$html = $result->html();//节点HTML代码

可以通过这个方法实现一个简单的网页爬虫,抓取HTML节点代码

以简书为例,爬取一篇文章内容

$phpQuery = \phpQuery::newDocumentFile("https://www.jianshu.com/p/0c856519824d");
$title = \phpQuery::pq('title', $phpQuery)->text();//网页title
$content = \phpQuery::pq('.show-content', $phpQuery)->html();//文章内容节点

分享

评论


F

Forget 03月17日 回复

推荐