Xpath基础 - 代码天地

Xpath基础

其他 2018-11-17 23:14:25 阅读次数: 0

版权声明： https://blog.csdn.net/djs123DJS/article/details/83688772

https://www.bilibili.com/video/av19689660/?p=6 视频的链接

Xpath 是一门从html中提取数据的语言：

Xpath的语法： 1. '/'是选择节点（标签）：' /html/head/meta' :表示的是能够选中html 下的head下的所有的meta 标签

2. ‘//’:能够从任意节点开始选择 ‘//li’: 表示的是当前页面上的所有li 标签 '/html/head//link' :表示的是head 下的所有的link标签

head下的子节点和子孙节点的所有的link标签。

3.‘@符号的用法’：选择具体某个元素 ‘//div[@class='xxx']/ul/li’ 选择‘xxx’的div下的ul下的li 那个‘[]’表示的是选中一个区块，然后再在这个区块('xxx')下选择其他的标签。

‘a/@href’ :表示的是选择a的href的值

4.获取文本用‘/a/text()’ :获取a下的文本

‘/a//text()’: 获取a下的所有的文本

从一个节点选到另外一个节点用的是‘/’ ，从根节点选择的时候也是用‘/’ ，从任意节点选择的话就用‘//’，这个也表示选择全部。

'./' 表示的是当前标签下的比如table.xpath（".//div"） ,表示的是当前table下的div

Xpath 有很多种选择的，推荐使用谷歌的插件 Xpath Helper 进行测试，然后拿数据，不用一步一步地定位

用//table 时要注意其他地方也会有相同的table,以此类推。

通过竖线 | 可以实现表达式的拼接。

使用xpath helper 或者是chorme 中的copy xpath 都是从element中提取的数据，但是爬虫获取的是url对应的响应，往往和element不一样。在确保爬虫获取url的响应和element一样的时候才可以用这些工具，或者要的数据一样。在后续的爬虫代码里面可能用不到它，要自己用肉眼去看去写。

猜你喜欢

转载自blog.csdn.net/djs123DJS/article/details/83688772

Xpath基础

XPath基础笔记

Xpath基础总结

爬虫基础 Xpath语法

xpath的基础语法

xpath的基础使用

xpath基础学习

XPath基础知识

python爬虫基础 - XPATH

爬虫基础（三）xpath

xpath的基础知识

xpath解析基础

Xpath基础语法介绍

Xpath语法基础

爬虫基础框架之xpath(一) --- xpath基础

爬虫基础——正则、xpath、lxml

爬虫之XPath基础篇

xpath基础规则-爬虫相关

Python中的xpath基础使用

爬虫-xpath基础实例演示

xPath和html基础扫盲

Python爬虫 xpath解析基础

XPATH

xpath的|

python+selenium基础之XPATH定位

dom4j及xpath基础应用

scrapy基础之 xpath网页结构

Spider学习笔记（一）:xpath基础操作

网络爬虫基础-Xpath语法(一)

java基础（二十七）：XPath

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

更多

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)