php XPath爬取小说站内容 - 代码天地

php XPath爬取小说站内容

其他 2018-11-08 18:06:30 阅读次数: 0

今天复习php的时候看到dom这个扩展，想了想在php里面貌似最大的用途就只是xpath

$content = file_get_contents("https://read.qidian.com/chapter/bLkfqG4_EUSoUTngny7bXQ2/lUKaD4PkCBRp4rPq4Fd4KQ2");
$doc = new DOMDocument('1.1', 'utf-8');
try {
    $doc->loadHTML($content);
} catch (Exception $e) {
    $e->getMessage();
}

$xpath = new DOMXPath($doc);
$elements = $xpath->query("//div[@class='read-content j_readContent']");
foreach ($elements as $element) {
    $nodes = $element->childNodes;
    foreach ($nodes as $node) {
        echo $node->nodeValue . "\n";
    }
}

就到这了等过段时间工作稳定可能会详细的出一篇文章介绍php爬虫的

猜你喜欢

转载自blog.csdn.net/a99361481/article/details/81546467

php XPath爬取小说站内容

PHP爬取网页内容

爬取千千小说 -- xpath

利用python的requests和BeautifulSoup库爬取小说网站内容

python爬取网站内容

PHP 爬虫体验（三） - 使用PHP + puppeteer爬取js动态渲染的页面内容

php实现爬取数据

php 爬取超链接

php 通过Xpath 抓去网站的内容

c++ 爬取小说内容（未完）

scrapy爬取小说内容并存储

用python爬取小说章节内容

爬虫初体验-爬取小说内容

BS4爬取小说内容

Python爬取文章和小说内容

爬取小说xpath （某币蛆ge）懂得都懂

java使用代理ip爬取网站内容

PHP加JavaScript爬取网页内容，超实用简易教程

PHP之使用CURL爬取文章列表、略缩图、及文章内容

php - 防止百度蜘蛛，谷歌蜘蛛等搜索引擎蜘蛛爬取内容

php curl 需要登录爬取页面

基于 PHP 的数据爬取（QueryList）

python爬取百度新闻数据,python爬取新闻网站内容

php使用xpath来进行采集页面的内容

话本小说网-文章内容爬取

千峰教育-python爬取网页小说内容

基于JSoup的网络爬虫爬取小说内容

Python爬虫入门：爬取某个网页的小说内容

爬虫爬取小说《动物农场》全部章节内容

python 爬取小说

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)