scrapy框架中选择器的使用 - 代码天地

scrapy框架中选择器的使用

其他 2018-06-03 17:32:01 阅读次数: 1

Selector选择器

Scrapy框架提供了自己的数据解析方法，即Selector（选择器）。

1、Selector（选择器）是基于lxml来构建的，支持XPath、CSS选择器以及正则表达式，功能全面，解析速度和准确度非常高。

2、Selector（选择器）是一个可以独立使用模块。直接导入模块就可实例化使用。

==========================================================================

XPath选择器

在Scrapy框架中使用response.selector属性返回内容相当于response的body构造了一个Selector对象。
Selector对象可以调用xpath（）方法实现信息的解析提取。
1、在xpath（）后使用extract（）可以返回所有的元素结果。
2、若xpath（）有问题，那么extract（）会返回一个空列表。

3、在xpath（）后使用extract_first（）可以返回第一个元素结果。

==========================================================================

CSS选择器

css选择器在Scrapy框架中使用与上面的xpth使用方法差不多，都是在response.selector属性返回的Selector对象来去调用并使用，下面的取值方式也一样
1、在css（）后使用extract（）可以返回所有的元素结果。
2、若css（）有问题，那么extract（）会返回一个空列表。

3、在css（）后使用extract_first（）可以返回第一个元素结果。

==========================================================================

re正则匹配

在scrapy中的response不可以直接使用正则re（）和re_first（）方法。

只能通过response先去调用xpth或selector的基础上去使用

例如：
response.xpath("//head").re("<title>(.*?)</title>")
response.selector.re("<a .*?>(.*?)</a>")

猜你喜欢

转载自blog.csdn.net/levon2018/article/details/80503223

scrapy框架中选择器的使用

Scrapy框架中选择器的用法【转】

Scrapy中选择器的用法

Python爬虫从入门到放弃（十四）之 Scrapy框架中选择器的用法

Python之爬虫（十六） Scrapy框架中选择器的用法

vue 中选择器的使用

单独使用 Scrapy 框架的 Selector 选择器

Scrapy框架中Selector(选择器)的使用

三、Scrapy中选择器用法

CSS中选择器

scrapy框架之选择器

Jquery中选择器的使用笔记2

Jquery中选择器的使用笔记1

jQuery中选择器综合使用案例

小程序中选择器picker使用

jstl和el的区别；css中选择器的使用

HTML中选择器的使用及优先级比较

HTML5中选择器querySelector的使用

scrapy框架【Pipelines选择器】 scrapy框架之Selectors选择器

Scrapy——选择器

scrapy选择器

jQuery中选择器（包含实例）

6中选择器的运用

NIO中选择器Selector

Python爬虫框架 scrapy之xpath选择器 css选择器

scrapy Selector 选择器

Scrapy——选择器(Selectors)

Scrapy Selector选择器

scrapy选择器归纳

Scrapy 选择器（Selectors）

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

【转】spring中对控制反转和依赖注入的理解

tms webcore 安装和使用

java程序员进阶相关书籍

SpringMVC接受请求参数、

如何保存训练好的机器学习模型

MyEclipse、Eclipse设置项目JDK的三个地方

商超行业微信小程序开发定制一般多少钱（行业技术人员解读）

Markdown编辑器语言——30分钟入门到到精通

Linux系统下MongoDB的简单安装与基本操作

Power Strings

每日归档

更多

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)