python爬虫(二)-------------------Xpath

xpath比css功能更强大,它更复杂,节点之间的关系功能更多,有父、子、同胞(兄弟)、先辈、后代

重点在于层级切换

下面这些基本就够用了,更多牛逼的功能一般用不到

bookstore 选取bookstore元素的所有子节点

/bookstore 选取根元素bookstore

/bookstore/book 选取属于bookstore的子元素的所有book元素

//book 选取所有book元素,而不管它们在文档中的位置。

bookstore//book 选择属于bookstore元素的后代的所有book元素

//@lang 选取名为lang的所有属性

/bookstore/book[1] 第一个book元素

/bookstore/book[last()] 最后一个book元素

/bookstore/book[position()<3] 选择前2

//title[@lang] 选择所拥有有名为lang的属性的title元素

/bookstore/book[price>35.00]

. 当前节点

.. 当前节点的父节点

猜你喜欢

转载自blog.csdn.net/qq_41228218/article/details/88959716