xpath获取标签对本身含内容 - 代码天地

xpath获取标签对本身含内容

其他 2019-06-16 18:51:28 阅读次数: 0

通常使用xpath我们直接定位到标签后, 使用/text() 或 //text()来获取标签对之间的文本值,

但特殊情况下我们也需要获取标签本身含文本值, 操作如下:

文件为html, 标签对结构如下:

<table id='1h'> 
　　<tr>
　　 　 <td>Row value 1</td> 
　　　　<td>Row value 2</td> 
　　</tr>
</table>

代码如下:

from lxml import etree
import requests
from lxml.html import fromstring, tostring
url = "https://www.baidu.com/"

ret = requests.get(url, headers=headers)
code = ret.apparent_encoding  # 获取url对应的编码格式
ret.encoding = code
html = ret.text               # html文件内容即示例中的标签

tree = etree.HTML(html)
result = tree.xpath('//*[@id="lh"]')[0]

print('看结果这里', tostring(result, encoding=code).decode(code))

注: tostring()方法即可把通过xpath定位到的标签(含该标签)及其下的所有标签输出,
　　切记使用decode()方法来进行解码

猜你喜欢

转载自www.cnblogs.com/quzq/p/11032413.html

xpath获取标签对本身含内容

python xpath获取一个标签下的所有文本内容（含子标签）

xpath获取相同标签多个内容

js获取html标签内容和包含标签本身与内容的方法

xpath 获取指定标签后的文本内容

xpath获取第1个以后的所有标签内容

xpath获取同级标签

xpath获取内容的方式

jquery 如何获取标签本身的文本内容，不包含子元素

jquery如何获取标签本生的文本内容，不获取本身子级元素及子级元素的内容

xpath解析网页，xpath获取网页的内容

Jquery获取html标签，包含该标签本身

xpath提取 html标签的文字内容

获取p标签的内容

获取标签中的内容

html 文本解码 xpath 获取html标签

(python)Xpath如何提取html标签（HTML标签和内容）

scrapy xpath获得a标签内的br em标签文字内容

JS获取包含当前节点本身的代码内容(outerHtml)

【xpath】获取某标签下的所有子标签的文本

xpath获取不包含某一子标签的a标签

BeautifulSoup获取 title 标签的内容

jquery 获取标签内的内容

JS获取标签内容的方法

python xpath提取标签内的所有内容(scrapy版本)

python 根据标签名获取标签内容

xpath提取包含标签的所有文本内容 - xpath常用语法汇总

用xpath获取指定标签下的所有text

xpath获取当前标签下的所有文本

python爬虫学习（十四）xpath获取不同标签城市名

今日推荐

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

周排行

static方法和非static方法的区别（java）

如何查找计算机专业paper

java.lang.ClassFormatError: Incompatible magic value 0 in class file com/sitecha

跳跃游戏II

stm32_之【建立工程】

TeaWeb v0.0.9 发布，统计底层优化、主机监控功能改进

事件分发 -----控制字体大小

JavaScript DOM练习（动态表格添加） December 25，2019

JSF Scope & CDI

实现从零搭建一个登录注册页面（附源代码）

每日归档

更多

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)