爬虫之Xpath语法学习 - 代码天地

爬虫之Xpath语法学习

其他 2020-02-17 14:40:01 阅读次数: 0

1.xpath:是一门在XML和HTML文档中查找信息的语言，可以用来在XML和HTML文档中对元素和属性进行遍历。

在爬虫中需要下载lxml库

2.语法

/ 代表从根节点选取；

// 代表选取所有的孩子

. 选取当前节点

.. 选取当前节点的父节点

元素[@id="值"] 选取“元素”的id等于“值”的元素内容

text（）选择当前标记下的文字内容

@属性名：获取当前元素的该属性

元素.xpath():在该元素下找相应的（比如在指定元素中找A标签而不是在所有的代码中找a标签）

扫描二维码关注公众号，回复： 9218339 查看本文章

举例：

bookstore	选取 bookstore 元素的所有子节点。
/bookstore	选取根元素 bookstore。注释：假如路径起始于正斜杠( / )，则此路径始终代表到某元素的绝对路径！
bookstore/book	选取属于 bookstore 的子元素的所有 book 元素。
//book	选取所有 book 子元素，而不管它们在文档中的位置。
bookstore//book	选择属于 bookstore 元素的后代的所有 book 元素，而不管它们位于 bookstore 之下的什么位置。
//@lang	选取名为 lang 的所有属性。

3.先输入网址，爬取内容，对内容进行解析

4.在Chrome上安装插件XPath Helper，可以输入相关xpath语句进行输出内容，便于调试，减轻爬虫的测试，提高效率

安装差插件：

右上角（如图红圈）---点击更多工具----拓展程序，如图：

找到XPath Helper下载安装，有的版本直接勾选就行

发布了233 篇原创文章 · 获赞 20 · 访问量 3万+

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_42565135/article/details/104279341

爬虫之Xpath语法学习

Xpath爬虫语法学习

freeradius之unlang语法学习

OpenResty之Lua语法学习

Python语法学习一之基础语法

MarkDown语法学习

markdown 语法学习

JAVA语法学习

lua语法学习

Smali 语法学习

Matlab的语法学习

JavaScript语法学习

scala语法学习

shell语法学习

less语法学习

SQLite语法学习

python语法学习

MongoDB语法学习

Logos语法学习

HTML语法学习

Oracle语法学习

模板语法学习

Dart语法学习

elasticsearch语法学习

golang语法学习

MarkDwon语法学习

【MySql】语法学习

Vue的语法学习

php语法学习

sql语法学习

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)