爬虫（xpath） - 代码天地

爬虫（xpath）

其他 2019-02-22 11:01:30 阅读次数: 0

1. 什么是xpath

XPath即为XML路径语言（XML Path Language），它是一种用来确定XML文档中某部分位置的语言。

2. xpath在爬虫中的使用

2.1 导入第三方模块：
	import lxml.etree as etree
2.2 将爬取到的html内容转化为xpath可以解析的格式：
	selector = etree.HTML(html)
2.3 xpath的常见表达式：
	nodename			选取此节点的所有子节点
	/					从当前节点选取直接子节点
	//					从当前节点选取子孙节点
	.					选取当前节点
	..					选取当前节点的父节点
	@					选取属性
	*					通配符
	@*					选取所有属性
	[@attrib]			选取具有给定属性的所有元素
	[@attrib='value]	选取给定属性具有给定值的所有元素
	[tag]				选取所有具有指定元素的直接子节点
	text()			选取此节点的内容（列表）
	[tag='text']		选取所有具有指定元素并且文本内容是text的节点
2.4 选取出需要的信息：
	例：courseDetails = selector.xpath('//div[@class="course-
	card-container"]')

猜你喜欢

转载自blog.csdn.net/qq_43281189/article/details/87798264

爬虫 - XPath

爬虫 xpath

爬虫——xpath

爬虫_xpath

爬虫（xpath）

XPath爬虫

爬虫的xpath

【爬虫】Xpath高级用法

XPath与多线程爬虫

爬虫 xpath (数据提取)

Python爬虫-xpath

爬虫之Xpath详解

爬虫xpath的使用 xml

网页爬虫XPath 定位

【爬虫入门2】xpath

python 爬虫 XPath

爬虫之XPath语法

python爬虫xpath的语法

爬虫——BeautifulSoup和Xpath

XPATH(lxml)爬虫测试

xpath在爬虫中的使用

爬虫基础 Xpath语法

Xpath语法-爬虫(一)

爬虫之Beautifulsoup及xpath

笔记-爬虫-XPATH

爬虫14-xpath

python爬虫 xpath使用

Scrapy爬虫：XPath语法

Java爬虫--Xpath解析

网络爬虫：xpath

今日推荐

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

“百模大战”必有一战 | 2024中国“百模大战”竞争格局分析

最强开源大模型 Llama 3 上架 Gitee AI

周排行

自媒体文章如何提高原创度以及如何检测原创度

开启qq邮箱的smtp服务

Qt程序单次启动（QSingleApplication类）

国外的外包网站

更新IDEA主题——放飞代码风格

cocos2dx 实现搓牌效果（翻牌效果），包括铺平动画

dict和json之间的互相转换

angular的一些思考

. Fibonacci数列是这样定义的： F[0] = 0 F[1] = 1 for each i ≥ 2: F[i] = F[i-1] + F[i-2] 因此，Fibonacci数列就形如：0, 1

洛谷P1064 金明的预算方案

每日归档

更多

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)

2024-04-17(5)

2024-04-16(70)