thinkphp5 composer 安装QueryList扩展(PHP的采集插件)

首先,在命令行中cd到自己的项目目录下

使用:

composer config -g repo.packagist composer https://packagist.laravel-china.org

切换镜像源

使用:

composer require jaeger/querylist

安装

安装成功.

注意:自己的PHP版本, 以及对应的QueryList文档(这里的版本是4.0,参考文档地址:https://doc.querylist.cc/site/index/doc/2)

以下是根据文档中的例子进行的简单操作

<?php
namespace app\index\controller;

use QL\QueryList;
class Index
{
    public function index()
    {
        $html = file_get_contents('https://querylist.cc/');
        //采集规则
        $rules = [
            //采集img标签的src属性,也就是采集页面中的图片链接
            'name1' => ['img','src'],
            //采集class为content的div的纯文本内容,
            //并移除内容中的a标签内容,移除id为footer标签的内容,保留img标签
            'name2' => ['div.content','text','-a -#footer img'],
            //采集第二个div的html内容,并在内容中追加了一些自定义内容
            'name3' => ['div:eq(1)','html','',function($content){
                $content += 'some str...';
                return $content;
            }]
        ];
        // 过程:设置HTML=>设置采集规则=>执行采集=>获取采集结果数据
        $data = QueryList::html($html)->rules($rules)->query()->getData();
        //打印结果
        print_r($data->all());

    }
}

各种方法的使用,文档中都有详细解释.

马克一下.

猜你喜欢

转载自blog.csdn.net/Gino_tkzzz/article/details/83275436