使用etree与xpath爬取Discuz论坛 - 代码天地

使用etree与xpath爬取Discuz论坛

其他 2020-02-25 10:30:06 阅读次数: 0

引入模块

在pycharm中下载lxml库
通过from lxml import etree引入模块

测试

import requests
from lxml import etree
url = "https://www.discuz.net/forum-developer-1.html"
text = requests.get(url).text
html = etree.HTML(text)
context = etree.tostring(html).decode()
print(html.xpath('//div[@id="threadlist"]/div[2]/form/table/*'))
print(html.xpath('//*[@id="threadlisttableid"]/*'))

在这里插入图片描述

这里是通过xpath语法将论坛的所有tbody便签

print(html.xpath('//tbody/tr/th/a[@class="s xst"]/text()'))

在这里插入图片描述

浩翰Redamancy

发布了126 篇原创文章 · 获赞 35 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_43442524/article/details/103179535

使用etree与xpath爬取Discuz论坛

用Scrapy写的定向爬虫，爬取目标是使用Discuz框架的论坛

使用xpath爬取数据

起点中文网小说爬取-etree，xpath，os

discuz论坛的使用

使用xpath技术爬取段子网

使用XPath爬取网页数据

使用XPath爬取西刺代理

使用xpath爬取壁纸图片

python2.7 用urllib2 etree xpath第三方模块爬取美女图片

Ubuntu 使用 Discuz搭建论坛

使用Requests+xpath实现简单的数据爬取

网络爬虫 - 5 Xpath的使用方法与爬取案例

使用xpath方法爬取丁香网的评论消息

使用xpath爬取猫眼电影排行榜

python使用XPATH爬取电影票房

python 使用xpath/lxml爬取网页表格并存CSV

使用爬虫xpath提取数据-爬取美女图片

Python《使用lxml解析xpath--爬取konachan》

python从入门到放弃篇26(lxml.etree库，urllib.request库，构造xpath路径，构造url）实现翻页爬取豆瓣书简介并保存数据

xpath；；利用xpath爬取电影天堂

利用xpath爬取网页

xpath-房价爬取

python xpath图片爬取

爬取千千小说 -- xpath

python笔记28-lxml.etree爬取html内容

python爬虫的简单复习1【使用etree进行XPath解析】

requests--etree--xpath

python爬虫（二）lxml.etree的使用（五分钟爬取大学生兼职网）

python从入门到放弃篇25（lxml.etree库，urllib.request库，xpath方法，for循环构造xpath路径）爬取一刀999页面，并保存数据。

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)