xpath语法总结

最近再看爬虫,用到了xpath提取内容,接下来记录一下xpath语法:


1 ‘/’ 从根节点选取。
假如路径起始于正斜杠( / ),则此路径始终代表到某元素的绝对路径!


2 // 从匹配选择的当前节点选择文档中的节点,而不考虑它们的位置。
也就是说以//开头的不会考虑这个元素在那个位置,在任何位置都可以匹配到


3 . 选取当前节点。


4 .. 选取当前节点的父节点。


5 @ 选取属性。
/book/@title 代表的是book下title元素的值


6 星号*表示选择所有由星号之前路径所定位的元素
比如:/book/title/* 代表的是在title下的所有元素都匹配
/* /* /* 代表的是有两个父节点的任意元素
@*表示匹配任何属性节点。
//title[@*]表示选取所有带有属性的 title 元素。
//BBB[not(@*)],选择所有没有属性的BBB节点


7 /AAA/BBB[1]代表选择AAA的第一个BBB元素
/AAA/BBB[last()]一看就懂
/bookstore/book[last()-1]一看就懂
/bookstore/book[price>35.00]
/bookstore/book[price>35.00]/title代表的是选择bookstore中book元素大于35下的title元素


8 通过在路径表达式中使用“|”运算符,可以选取若干个路径。
//title | //price 表示选择文档中的所有title或者price元素


——————————–end

猜你喜欢

转载自blog.csdn.net/snailpeople/article/details/78135385