crawler的简单运用（类似phpquery） - 代码天地

crawler的简单运用（类似phpquery）

其他 2019-03-25 19:02:06 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/wt1286331074/article/details/88422343

参考：http://www.php.cn/php-weizijiaocheng-376167.html （中文）
https://symfony.com/doc/current/components/dom_crawler.html （官方英文）
因为是项目中运用，首先composer下composer require symfony/dom-crawler然后use写代码

$html = <<<HTML
        <body>
        Hello World!
        Hello Crawler!
<p class="p-1">我是p标签11</p>
<p class="p-2">我是p标签22</p>

<p class="p-3">
    <a alt="first" href="www.first.com"><img src="www.img222.com" alt="tu1">独一</a>
    <a ><img src="www.img.com" alt="tu2"></a>
</p>

</body>
HTML;
        $crawler = new Crawler($html);
        echo $crawler->filterXPath('//body/p')->text();// 获得里面的dom
        // 获得内容里面重复的标签内容
        foreach ($crawler->filterXPath('//body/p') as $i=>$node){
            $c = new Crawler($node);
            echo $c->filter('p')->text();
        }
        $nodeValues = $crawler->filterXPath('//body/p')->each(function (Crawler $node,$i){
            return $node->text();
        });
        // 获得第二个p标签的class属性值
        echo $crawler->filterXPath('//body/p')->last()->attr('class');

        // 根据特定的class属性搜
       echo $crawler->filterXPath('//p[@class="p-2"]')->text();
        // 寻找，抽取属性
         $dataArr = $crawler->filterXPath('//p[@class="p-3"]')->filter('a>img')->extract(array('alt'));

猜你喜欢

转载自blog.csdn.net/wt1286331074/article/details/88422343

crawler的简单运用（类似phpquery）

crawler

recyclerView的简单运用及其监听的自定义（类似于ListView）

【转载】crawler4j简单总结

phpQuery简介

【Java-Crawler】HttpClient+Jsoup实现简单爬虫

Java cookie的简单运用

Kmp简单运用

NodeJs的EventEmitter的简单运用

servlet类的简单运用

Quartz 简单运用

html 的简单运用

Connect By的简单运用

Docker 简单运用

【IOS】UIappearance的简单运用。

结构体的简单运用

scipy 矩阵简单运用

nohup 简单运用

Angular.的简单运用

递归的简单运用

java 简单框架的运用

npm简单运用

ibatis的简单运用

装饰器的简单运用

turtle模块的简单运用

VUEX的简单运用

ajax简单运用

canvas 的简单运用

HttpClient的简单运用

Cookie的简单运用

今日推荐

技术解析 GPT-4o：即时语音交互的突破与 GenAI 发展策略

开源大模型与闭源大模型

微信小程序授权登录获取用户的openid

亿级流量系统架构设计与实战

人工智能时代的程序设计教学与课程设计

纽交所技术问题致伯克希尔 (BRK.A) 显示跌近 100%

探索 api.maynor1024.live：一站式 AI 服务平台

AI一键去衣技术：窥见深度学习在图像处理领域的革命(最后有彩蛋)

艾体宝案例 | 使用Redis和Spring Ai构建rag应用程序

Apple M1 vs 高通8Gen2 vs Apple A12Z各方面比较

【升职加薪必备架构图】Springboot学习路线汇总_springboot四层架构流程图

与Apollo共创生态：Apollo7周年大会自动驾驶生态利剑出鞘

周排行

timesten性能问题分析

hdu1017A Mathematical Curiosity

利用FragmentTabHost和ViewPager来实现可滑动切换的页面

哪里找卖百度云资源

大数据技能图谱

PHP设计模式（5）—— 观察者模式

python list删除元素是要注意的坑点

TPM简介

并查集擒贼先擒王//解密犯罪团伙

码农也要修身

每日归档

更多

2024-06-04(10)

2024-06-03(52)

2024-06-02(4)

2024-06-01(60)

2024-05-31(47)

2024-05-30(4)

2024-05-29(65)

2024-05-28(2)

2024-05-27(56)

2024-05-26(6)