Xpath教程 - 代码天地

Xpath教程

其他 2018-08-15 05:18:32 阅读次数: 0

from lxml import etree
import requests # urllib urllib2 urllib3

url = "https://www.qidian.com/free/all"
response = requests.get(url=url)
response.encoding = response.apparent_encoding

root = etree.HTML(response.content)

查找网页内某个标签,例如 title

root.xpath('//title')

获取某个标签的内容, 例如<title>网页标题 </tit le>

root.xpath('// title/text()')

获取某个标签及子标签下的内容, 例如<title>网页标题 </tit le>

root.xpath('// title//text()')

获取img标签的src属性例如<img sr c="1. jpg" />

ro ot.xpath('//img/@src')

根据id精确查找标签内容 <img src="1.jpg" id="img1"/>

root.xpath(' //img[@id="img1"]/@src')

根据class查找标签内容 <a c la ss="a1">标签</a>

root. xpath('//a[@class="a1"]/text()')

根据其它属性查找标签内容 <a data="cate" title="a" name="a">分类1</a>

root.xpath('//a[@data="cate"]/text()')

root.xpath('//a[@title="a"]/text()')

root.xpath('//a[@name="a"]/text()')

根据标签内容查找标签 <a>下一页</a>

root.xpath('//a[text()="下一页"]')

使用string('.') <a c la ss="a1">标签</a>

root.xpath('//a[@class="a1"]').xpath('string(.)')

属性模糊定位 <a class="a1">123</a>

root.xpath('//a[contains,(@class,"a")]')

文本模糊定位 <a href="http://www.baidu.com">百度搜索</a>

root.xpath('//a[contains,(text(),"百度")]')

猜你喜欢

转载自blog.csdn.net/qq_41949802/article/details/81669823

Xpath教程

XPath 教程

xpath教程 3 - xpath的小结

python xpath教程

XPath Helper使用教程

python爬虫教程：Xpath

python爬虫xpath教程

Xpath安装及简单教程

chrome的xpath插件安装教程

Xpath+lxml简单教程

xpath在谷歌下的安装教程

Python爬虫教程-21-xpath简介

Python爬虫教程-21-xpath

【Scrapy教程】02 Xpath选择器

xpath 注入工具和视频教程

Selenium教程系列（五）：xpath进阶

Selenium教程系列（四）：xpath基本语法

Python爬虫2.2 — xpath用法教程

xPath解析HTML学习速成教程

XPATH

xpath的|

网页结构的简介和Xpath语法的入门教程

[XPath] XPath 节点

【Xpath】 xpath语法总结

Python爬虫教程-22-lxml-etree和xpath配合使用

python爬虫教程：python3 xpath和requests应用详解

Python之requests+xpath爬取猫眼电影并写入数据库(图文教程)

xpath语法

XPath Nodes

XPath介绍

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)