scrapy-redis中url队列类型的控制(zset、list) - 代码天地

scrapy-redis中url队列类型的控制(zset、list)

其他 2019-06-16 10:21:43 阅读次数: 0

说明：scrapy-redis在进行数据请求是能够实现url的自动保存到redis中，但是保存的数据结构类型是和setting配置文件中的优先级队列的选择挂钩的。

注意：当url的保存类型和url的提取方式不匹配会报错

比如：通过list数据结构的数据提取的方式提取zset中的数据

redis中list的数据提取方式：lpush key

redis中zset的数据提取方式：zrange key start end

(error) WRONGTYPE Operation against a key holding the wrong kind of value

一、三种优先级队列：

# 指定排序爬取地址时使用的队列，
# 默认的 按优先级排序(Scrapy默认)，由sorted set实现的一种非FIFO、LIFO方式。
# SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderPriorityQueue'
# 可选的 按先进先出排序（FIFO）
SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderQueue'
# 可选的 按后进先出排序（LIFO）
# SCHEDULER_QUEUE_CLASS = 'scrapy_redis.queue.SpiderStack'

二、优先级队列对应url在redis中保存的数据类型

scrapy-redis默认的优先级队列:zset

先进先出(FIFO):list

先进后出(LIFO):list

三、队列提取方式的选择

REDIS_START_URLS_AS_SET = True

可以在setting配置文件中配置这一行代码。

True：redis中以set集合提取数据的方式提取

False：redis中以list列表提取数据的方式提取

猜你喜欢

转载自blog.csdn.net/ryuhfxz/article/details/85782467

scrapy-redis中url队列类型的控制(zset、list)

定制起始url(scrapy-redis)

scrapy-redis中redis的设置

scrapy-redis

scrapy-redis组件

scrapy-redis架构

爬虫scrapy-redis

scrapy-redis 框架

Scrapy-redis 组件

scrapy-redis 设置

redis中list set zset的区别

Scrapy改成Scrapy-Redis

Scrapy、Scrapy-redis组件

Redis中Zset类型常用的命令

7、Redis中对ZSet类型的操作命令

Redis中对ZSet类型的操作命令

【Redis】05 数据类型string list set zset hash

redis-数据类型-string、hash、list、set、zset

Scrapy-redis分布式+Scrapy-redis实战

scrapy-redis scrapy-redis使用以及剖析

scrapy-redis的安装部署

scrapy-redis的使用与解析

scrapy-redis源码分析

关于scrapy-redis的问题

scrapy-redis使用详解

Scrapy-Redis源码解读

Scrapy-Redis入门实战

scrapy-redis源码浅析

Scrapy-Redis简单使用

Scrapy 和 scrapy-redis的区别

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)