爬虫中xpath 父标签不存在子标签时设置默认值

问题:

开发过程中发现问题 :在某个标签下 的字标签可能存在也可能不存在
当子标签不存在时 拿取父标签下的 text内容
等子标签存在时 给设置个默认值

具体实现方式

response.xpath(
“//div[@class=‘tab-pane’]/table[4]/tbody/tr[4]/td[not(contains(i/@class,‘class -calaaa’))]/text()”).extract_first( default=“已证明”)

通过 not 和contains 函数实现对其的 是否 td 下含有 i 标签的 判断 并设置默认值

猜你喜欢

转载自blog.csdn.net/weixin_40809627/article/details/84779128
今日推荐