PHP之phpQuery爬虫

发布日期: 2019-03-14 18:09:28 作者: Stephen 评论: 1

用phpQuery简单实现网页内容爬虫

安装方法:

composer require jaeger/querylist

用法:

$phpQuery = \phpQuery::newDocumentFile($url);
$result = \phpQuery::pq('.art_content', $phpQuery);//.art_content 节点
$string = $result->text();//节点文本内容
$html = $result->html();//节点HTML代码

可以通过这个方法实现一个简单的网页爬虫,抓取HTML节点代码

以简书为例,爬取一篇文章内容

$phpQuery = \phpQuery::newDocumentFile("https://www.jianshu.com/p/0c856519824d");
$title = \phpQuery::pq('title', $phpQuery)->text();//网页title
$content = \phpQuery::pq('.show-content', $phpQuery)->html();//文章内容节点

Forget 5年前
推荐