python lxml用法 - 代码天地

python lxml用法

编程语言 2023-09-15 18:54:37 阅读次数: 0

lxml是Python中一个非常流行的XML解析库。它提供了便捷的XML/HTML scraping及操作功能。主要的功能有:- 解析XML/HTML
- XPath和CSS选择器
- 在文档中导航和搜索
- 修改或创建XML/HTML
- 处理良好标记的(well-formed)以及不良好标记的(non well-formed) XML
- 支持XML Schema, RelaxNG, Schematron, DTD等安装:

pip install lxml

示例用法:解析HTML:

python
from lxml import html

# 加载HTML文档
doc = html.fromstring("""<p>Hello<br>World!</p>""")

# 获取所有p标签
ps = doc.findall("p")

# 获取第一个p标签内容 
p = ps[0]
p.text
# 'Hello\nWorld!'

XPath选择器:

python 
# 获取所有a标签
links = doc.xpath("//a")

# 获取href属性 
hrefs = [link.get("href") for link in links]

# 获取id为"main"的div内容
div = doc.xpath("//div[@id='main']")

修改XML:

python
from lxml import etree 

# 加载XML 
xml = etree.fromstring("""<book><title>Harry Potter</title></book>""")

# 修改title内容
xml.find("title").text = "Lord of the Rings"

# 打印修改后的XML
print(etree.tostring(xml, pretty_print=True).decode())

'''
<book> 
<title>Lord of the Rings</title>
</book>
'''

猜你喜欢

转载自blog.csdn.net/hb12342006/article/details/131260533

Python-- lxml用法

python进阶（lxml的用法）

python lxml用法

python的lxml和xPath用法

python中lxml模块下的xpath用法

Python爬虫利器三之Xpath语法与lxml库的用法

Python爬虫利器Xpath语法与lxml库的用法

芝麻HTTP：Python爬虫利器三之Xpath语法与lxml库的用法

python-lxml的demo

Python中安装lxml

python——解析库lxml

python安装lxml

Python-- lxml安装

python--lxml

python库——Lxml

python . lxml .html

Python的lxml库学习

python之lxml

python lxml处理xml

python教程lxml详解

【python爬虫】安装lxml模块

Python中lxml模块的安装

[python3 - package] lxml

python爬虫（三）xpath与lxml

python的lxml解析器

Windows下Python安装lxml

python爬虫入门（2）----- lxml

python ModuleNotFoundError: No module named 'lxml'

python中lxml模块的使用

Python爬虫之路-lxml模块

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)