python里的使用
- from lxml import etree
- r = etree.HTML(text) #解析html
- r.xpath(表达式) #返回一个列表
xpath表达式有两种方式,一是手写,二 使用浏览器拥有的审查元素(检查)功能里的copy xpath功能。
例如如下:
//*[@id=“app”]/div/div/div[1]/dl/dd[1]/div/div/div[1]/p[1]/a
在使用的时候在后边加/test()是内容
加/@href 是属性
python里的使用
例如如下:
//*[@id=“app”]/div/div/div[1]/dl/dd[1]/div/div/div[1]/p[1]/a
在使用的时候在后边加/test()是内容
加/@href 是属性