版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/Kwoky/article/details/83072202
这是一个翻页的按钮链接,需要用写一个LinkExtractor对象匹配下一页链接,但是没有下一页按钮
观察发现如下特征:
1、span class ="main title"
2、当前页的页码td下没有a标签,但是td下有u标签
想根据这些特征用xpath定位到下一个td下的链接,涉及到了兄弟节点的访问:
//span[@class="main_title"]//td/u/../following-sibling::td[1]/a'