一起来学习XPATH，来看看除了正则表达式我们还能怎么抓取数据 - 代码天地

一起来学习XPATH，来看看除了正则表达式我们还能怎么抓取数据

其他 2018-08-27 12:21:44 阅读次数: 0

参考学习的网站链接http://www.w3school.com.cn/xpath/xpath_intro.asp

首先理清楚一些常识

以此为例

<?xml version="1.0" encoding="ISO-8859-1"?>

<bookstore>

<book>
  <title lang="en">Harry Potter</title>
  <author>J K. Rowling</author> 
  <year>2005</year>
  <price>29.99</price>
</book>

</bookstore>

参照HTML的格式其实很多都只是换了一下名字而已还是很好上手的

节点（Node）

<bookstore> （文档节点）
<author>J K. Rowling</author> （元素节点）
lang="en" （属性节点）

基本值（或称原子值，Atomic value）

J K. Rowling
"en"

项目（Item）

项目是基本值或者节点。

然后是节点关系，父、子、同胞、先辈、后代，可以和树的知识一起理解

在语法上面基本上和正则一样，多练多记，实在记不住就要多查了

接下来介绍一下轴，用于定义当前节点的节点集

轴的作用就像集合，一次性锁定一大片元素、属性，aoe的伤害啊哈哈哈
在位置路径表达上面，最前面有/就是绝对，没有就是相对

再来看看步，这个就有点像c语言里面的类和对象的赶脚了


那么运算符都是通用的也就不介绍了，注意到是除法用div其他基本相同

基本上这里就足够日常的一些使用和查询了
关于它的函数部分一般爬虫也用不到，但为了方便大家也列一下
http://www.w3school.com.cn/xpath/xpath_functions.asp
最后就扔上实例的链接，按需查看，下期见嘻嘻
http://www.w3school.com.cn/xpath/xpath_examples.asp

猜你喜欢

转载自www.cnblogs.com/xingnie/p/9541393.html

一起来学习XPATH，来看看除了正则表达式我们还能怎么抓取数据

我们一起来学java8的lambda表达式Stream

虚拟数字人是怎样炼成的？让我们一起来看看吧

学会了C语言/C++能做什么？我们一起来看看吧！

优秀的室内设计网站有哪些？让我们一起来看看吧

选购哪种护眼灯对眼睛好，让我们一起来看看吧

ogg怎么转mp3格式？让我们一起来学习吧

用数据说话，让我们一起来看看都是哪些程序员在反对996！

java如何实现对Excel内容读写，如何将Excel内容导入导出数据库，让我们一起来看看

每天30分钟一起来学习爬虫——day9（解析数据之正则表达式，实例：笑话大全图片爬取）

让我们一起来学习Seata把！~~~~（一）

跟我一起学正则表达式

打太极拳需要具备的技能，“一换二开三活”，我们一起来看看

Google I/O 2023 大会上发布了一些令人兴奋的技术和产品，让我们一起来看看吧！

一起刷题学习Git/SQL/正则表达式

Rocky Linux能否能合法地获得RHEL源代码？让我们一起来看看吧

让我们一起来认识和学习一下MapReduce吧

gtiee教程(三板斧)-------好东西我们一起来学习

我们就一起来探讨一下关于vmware workstations

【我们一起来学 RabbitMQ 一】RabbitMQ 的基本介绍

让我们一起来改变自己吧

抽点时间让我们一起来学linux系统

让我们一起来做最漂亮的Android界面吧！

让我们一起来部署Nacos集群吧～

我们一起来学RabbitMQ 四：RabbitMQ windows 安装

让我们一起来备战蓝桥杯与CCF-CSP吧

一起精通java正则表达式[huiqinbo]

将RegEx（正则表达式提取器）与JMeter一起使用

Python正则表达式与split()方法一起使用

和小白一起学正则表达式

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)