解决方式,使用xpath解析后的element对象,打印一下(结果是源码的形态)。不要以页面和右键查看源码为准,而要以爬出来的代码为准
今天遇到个情况,页面的f12,右键的查看源码,和爬取出来的代码中的标签都有差异
排错方式:
打印element代码
string = etree.tostring(table, encoding='utf-8').decode('utf-8')
print(string)
1.图中tr是在tbody里面,但是代码获取不到,显示没有这个节点
2.但是在源码上却是叫table
改成table后即可解析到