数据提取-lxml模块

xpath语法-选取节点以及提取属性或文本内容的语法
在这里插入图片描述
选取特定节点的语法
在这里插入图片描述
选取未知节点的语法
在这里插入图片描述
lxml模块的使用

利用etree.HTML,将html字符串转化为Element对象,Element对象具有xpath的方法,返回结果的列表

from lxml import etree
html = etree.HTML(text) 
ret_list = html.xpath("xpath语法规则字符串")

xpath方法返回列表的三种情况:

  1. 返回空列表:根据xpath语法规则字符串,没有定位到任何元素
  2. 返回由字符串构成的列表:xpath字符串规则匹配的一定是文本内容或某属性的值
  3. 返回由Element对象构成的列表:xpath规则字符串匹配的是标签,列表中的Element对象可以继续进行xpath
发布了1 篇原创文章 · 获赞 1 · 访问量 30

猜你喜欢

转载自blog.csdn.net/weixin_44857400/article/details/105734830