xpath语法-选取节点以及提取属性或文本内容的语法
选取特定节点的语法
选取未知节点的语法
lxml模块的使用
利用etree.HTML,将html字符串转化为Element对象,Element对象具有xpath的方法,返回结果的列表
from lxml import etree
html = etree.HTML(text)
ret_list = html.xpath("xpath语法规则字符串")
xpath方法返回列表的三种情况:
- 返回空列表:根据xpath语法规则字符串,没有定位到任何元素
- 返回由字符串构成的列表:xpath字符串规则匹配的一定是文本内容或某属性的值
- 返回由Element对象构成的列表:xpath规则字符串匹配的是标签,列表中的Element对象可以继续进行xpath