爬虫问题记录（xpath）——一行文本被xpath解析成多行文本

数据库 2023-09-03 08:38:19 阅读次数: 0

首先先来看网页结构：

网页显示文本：

Python的xpath解析出来的结果：

出现问题的xpath写法：

xpath =  etree.xpath("//*[@id='review-list']//ul//div[4]/text()")
print(xpath)

可以看到在网页结构中，文本中间插入了img标签元素，在加上写xpath时在xpath后面添加了

/text（）

就会导致这个问题的出现。

暂时的解决方法：

xpath =  etree.xpath("//*[@id='review-list']//ul//div[4]")
print(xpath.text)

把要获取的文本内容移动到xpath之后就可以了，就是还有个问题，这样子就只会匹配到第一个文本。

后面的文本匹配不到，这个问题后面再看看怎么解决。

猜你喜欢

转载自blog.csdn.net/weixin_54243306/article/details/131042807

爬虫问题记录（xpath）——一行文本被xpath解析成多行文本

把多行文本合并成一行

css:一行文本或多行文本溢出显示省略号

Android NoteX Q6: 如何实现一行文本居中多行文本左对齐效果？

多行文本溢出最后一行显示省略号

ORACLE——将多行文本数据转换成一行

Linux系统多行文本转成一行的实现方法

CSS 多行文本最后省略号“...” 多行文本最后一行超出的部分隐藏并显示省略号的方法

十一、多行文本最后一行显示省略号并截取文本字数（vue）

【C程序设计语言第二版】打印多行文本中最长的一行文本

css_消除多行文本溢出显示省略号对最后一行行高的影响

C语言读取每一行文本

PTA 统计一行文本的单词个数

统计一行文本的单词个数

C++读取一行文本

统计一行文本的单词个数 (15 分)

统计一行文本的单词个数。

多行文本

css 单多行文本溢出及多行文本折行显示

PIXIJS中Text文本实现多行文本，换行，首行缩进；解决换行失效问题

记录——python将一行的文本拆成多行

单行，多行文本溢出。。。

textarea（多行文本域）

多行文本垂直居中

多行文本溢出隐藏

多行文本省略

单行、多行文本溢出

UILabel中的多行文本

多行文本溢出打点

DEV多行文本 MemoEdit

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)