使用extract()进行xpath解析的几种情况

其他 2018-06-04 06:08:00 阅读次数: 0

最近在做爬虫的细节整理，想要弄清楚一些原来没有注意的问题，特此总结！
在进行对HTML解析时我们可能会遇到如下五种情况：

这里写图片描述

返回一个SelectorList 对象

SelectorList 类是内建 list 类的子类，提供了一些额外的方法:
xpath(query)
css(query)
extract()
re()
__nonzero__()

返回一个list(就是系统自带的那个) 里面是一些你提取的内容
返回2中list的第一个元素(如果list为空抛出异常)
返回1中SelectorList里的第一个元素(如果list为空抛出异常),和3达成的效果一致
返回的是一个str, 所以5会返回str的第一个字符

猜你喜欢

转载自blog.csdn.net/alicelmx/article/details/79166198

使用extract()进行xpath解析的几种情况

【Selenium】Xpath的几种写法，其实很容易。使用Xpath定位，根据12306的选择车票进行学习

python爬虫的简单复习1【使用etree进行XPath解析】

在scrapy爬虫框架xpath中extract（）方法的使用

Xpath解析库的使用

xpath解析列表为空的情况

golang select的几种情况解析

Python如何利用Xpath进行解析

Python爬虫进行xpath解析实战

使用node.js第三方库xpath进行html文档解析

使用xpath实现document.querySelector样式选择器进行html解析（四）：将选择结果封装进行输出使用xpath实现document.querySelector样式选择器进行html解析（一）：将html转成xml 使用xpath实现document.querySelector样式选择器进行html解析（二）：扩展一下xpath以便支持正则

Oracle中使用Hint对目标SQL进行优化时几种被忽略的情况

Gosn对几种情况json数据解析

查询无法解析索引的几种情况

使用xpath实现document.querySelector样式选择器进行html解析（三）：实现样式选择器使用xpath实现document.querySelector样式选择器进行html解析（一）：将html转成xml 使用xpath实现document.querySelector样式选择器进行html解析（二）：扩展一下xpath以便支持正则

使用xpath实现document.querySelector样式选择器进行html解析（一）：将html转成xml 使用xpath实现document.querySelector样式选择器进行html解析（一）：将html转成xml 使用xpath实现document.querySelector样式选择器进行html解析（二）：扩展一下xpath以便支持正则

py使用xpath解析html 库

Python使用XPath解析HTML文档

C# 使用XPath解析网页

爬虫--解析库的使用 XPath、BeautifulSoup、pyquery

【转载】在Java中使用xpath对xml解析

go使用xpath解析 xml 格式信息

使用XPath对象解析xml文件

第4章解析库的使用---Xpath

解析HTML—— BeautifulSoup和xPath的基本使用

Python Xpath解析数据提取基本使用

Python使用XPath解析HTML的方法详解

Xpath解析

使用xpath实现document.querySelector样式选择器进行html解析（二）：扩展一下xpath以便支持正则使用xpath实现document.querySelector样式选择器进行html解析（二）：扩展一下xpath以便支持正则

Oracle不使用索引的几种情况列举

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)