Python 爬虫开发之xpath使用 - 代码天地

Python 爬虫开发之xpath使用

编程语言 2018-10-19 17:21:07 阅读次数: 0

在进行爬虫开发中，需要的页面信息进行解析处理，获取到需要的关键数据。可以利用xpath进行对页面的xml文件进行解析处理，获取到需要的关键数据。
XPath使用:
XPath 可用来在 XML 文档中对元素和属性进行遍历.
from lxml import etree
import urllib2
req = urllib2.Request(url)
req.add_header('User-Agent', 'Mozilla/4.0 (compatible; MSIE 5.5; Windows NT)')
web_info = urllib2.urlopen(req).read()
html = etree.HTML(web_info)
result = etree.tostring(html) #tostring 是补全缺失的html标签
html_data = result.xpath('/html/body/div/ul/li/a/text()') 获取某个标签的数据，返回的是对象，可以通过遍历得到具体的数据
html_data = html.xpath('/html/body/div/ul/li/a/@href') 获取某个标签的属性 获取属性值用@
html_data = html.xpath('/html/body/div/ul/li/a[@href="link2.html"]/text()') 获取a表现属性为link2.html的内容
html_data = html.xpath('//li/a/text()') 使用相对路径获取a标签的内容
html_data = html.xpath('//li/a//@href') 使用相对路径获取a标签的属性值

猜你喜欢

转载自blog.51cto.com/weadyweady/2306595

Python 爬虫开发之xpath使用

Python爬虫开发——XPath的使用

python爬虫之xpath的基本使用

python爬虫之xpath的使用方法

Python3--爬虫之Xpath使用

Python爬虫之xpath使用指南

python爬虫之xpath

python爬虫之xpath的基本使用 python爬虫之xpath的基本使用

python爬虫 xpath使用

Python之爬虫-- XML与XPath

Python爬虫之Xpath语法

python爬虫之xpath解析

python爬虫之xpath入门

Python爬虫从入门到进阶(4)之xpath的使用

Python笔记：网络爬虫之XPath、Beautiful Soup、PyQuery的使用

Python爬虫之解析库的使用(XPath、Beautiful Soup)

Python爬虫解析工具之xpath使用详解

（十八）Python爬虫：XPath的使用

Python案例：使用XPath的爬虫

Python爬虫神器Xpath的使用

Python爬虫——XPath的使用（B）

Python之XPath的使用

Python爬虫(十三)_案例：使用XPath的爬虫

Python爬虫(十一)_案例：使用XPath的爬虫

Python之爬虫-- etree和XPath实战

python爬虫学习之XPath基本语法

Python爬虫之（九）数据提取-XPath

Python爬虫：数据解析之 xpath

Python爬虫之lxml库和XPath

【Python】爬虫-----数据解析之Xpath解析

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)