基于scrapy_redis部署的scrapy分布式爬虫 - 代码天地

基于scrapy_redis部署的scrapy分布式爬虫

数据库 2018-09-30 05:16:58 阅读次数: 0

1. 首先使用命令行工具下载工具包 scrapy_redis
（如果使用的是虚拟环境，先进入到虚拟环境）
scrapy-redis：一个三方的基于redis的分布式爬虫框架，配合scrapy使用，让爬虫具有了分布式爬取的功能
github地址： https://github.com/darkrho/scrapy-redis
在这里插入图片描述
2.打开项目配置settings

找到settings文件,配置scrapy项目使用的调度器及过滤器
3. 修改爬虫文件

4.如果有连接远程服务，需要将远程服务连接开启
首先找到redis的安装目录

打开redis.windows.conf文件，并将下图一行改为
bind 0.0.0.0
是为了确保其他主机可以连接你的主机
在这里插入图片描述
用命令行进去到redis目录下，输入redis-cli.exe -h + ip地址
可以测试是否可以远程连接redis

5.开启爬虫
测试远程可以连接redis后就可以开启你的爬虫项目
然后你会发现你的项目会进入等待状态
这个时候用命令行工具进入redis目录下输入redis-cli.exe
然后lpush 输入你再项目中配置的redis_key
再输入你想爬取的第一个url 可以输入多个url 每个url用空格隔开
在这里插入图片描述
这样用scrapy_redis部署的分布式爬虫就开始爬取了
效果：所有爬虫都开始运行，并且每台主机爬取的数据还都不一样
最后将数据保存到你这台主机的redis数据库中

猜你喜欢

转载自blog.csdn.net/YiCun_/article/details/82902523

基于scrapy_redis部署的scrapy分布式爬虫

基于Scrapy_redis部署scrapy分布式爬虫

Scrapy基于scrapy_redis实现分布式爬虫部署

分布式爬虫scrapy_redis

Scrapy_Redis分布式爬虫

Scrapy基于scrapy_redis分布式爬虫的布隆去重

使用Scrapy_redis进行分布式爬虫

scrapy_redis分布式爬虫总结

十六、scrapy_redis（分布式爬虫）

scrapy_redis实现分布式爬虫

python爬虫之基于scrapy_redis的分布式爬虫

scrapy_redis分布式

Scrapy_Redis 分布式处理

Python爬虫之Scrapy框架系列（22）——初识分布式爬虫scrapy_redis

Centos7__Scrapy + Scrapy_redis 用Docker 实现分布式爬虫

python爬虫入门 ✦ 乞丐版scrapy_redis分布式 + 增量式爬虫的实现

Scrapy_redis分布式基础_redis使用

scrapy_redis分布式爬虫遇到的问题DEBUG: Filtered offsite request to

京东全网爬虫（scrapy_redis分布式，IP代理池反爬）

分布式scrapy_redis源码总结，及其架构

scrapy_redis分布式组件策略图解

运用scrapy框架爬取数据的流程和组件Scrapy_redis分布式爬虫的应用

【Python爬虫】轻松几步将一个 scrapy项目变成 scrapy_redis 分布式爬取

基于scrapy-redis的分布式爬虫

基于scrapy-redis的分布式爬虫简单使用

部署Scrapy分布式爬虫项目

scrapy-redis分布式爬虫

分布式爬虫 redis + mongodb +scrapy

分布式爬虫(scrapy-redis)

scrapy-Redis 分布式爬虫

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)