xpath的高级用法

这里先说两个.

1.取子标签中的最后一个标签,或者倒数的标签。

场景:标签数量会变动,但是顺序始终是倒数第一个或者倒数几个的情况:

td_list = html.xpath('/html/body/center[3]/table/tbody/tr/td/span/center/center[last()]/table/tbody/tr/td')

2.取某个标签下面的所有文本。

场景:想取某个标签下面的所有文本,如果仅仅用/text()只能取到这个标签里面暴露在外无标签的文本。

如果这个标签里面还有p,span等标签,那这些字就取不到了。此时果断放弃text()方法:

html.xpath('string(/html/body/table/tbody/tr/td[2])')

试试string(path),path不带text()

理论上//text()也可以。注意是两条杠,不是一条。两条表示取下面所有的,不考虑位置

发布了113 篇原创文章 · 获赞 24 · 访问量 40万+

猜你喜欢

转载自blog.csdn.net/qq_32394351/article/details/104102337