Gerapy分布式爬虫管理框架 - 代码天地

Gerapy分布式爬虫管理框架

其他 2018-08-02 05:15:03 阅读次数: 0

一，介绍

Gerapy 是一款分布式爬虫管理框架，支持 Python 3，基于 Scrapy、Scrapyd、Scrapyd-Client、Scrapy-Redis、Scrapyd-API、Scrapy-Splash、Jinjia2、Django、Vue.js 开发。

二，gerapy的初始化配置：

安装gerapy框架。（注意要先用命令进入虚拟环境）

命令：pip install gerapy

2.检查gerapy是否可用。

命令：gerapy

证明可用

3. 初始化gerapy，生成gerapy框架的工作目录。(在哪初始化，工作目录就创建在哪。初始化完成，进入gerapy文件夹，会有一个projects文件夹。)

命令： gerapy init

4.先进入gerapy目录，再执行gerapy数据库的初始化，建立相关的数据库表。

命令：cd gerapy

gerapy migrate

5.在gerapy目录下，启动gerapy服务，默认在8000端口。

命令：gerapy runserver

6.打开浏览器，输入：http://localhost:8000，可以看到 Gerapy 的主界面。

7.完成以上步骤，说明gerapy初始化成功了。但是现在还没有添加主机和项目，所有的主机数量和项目数量都是0。

三、配置gerapy的主机

点击左侧 Clients 选项卡，即主机管理页面，添加我们的 Scrapyd 远程服务，点击右上角的创建按钮即可添加我们需要管理的 Scrapyd 服务。
在cmd中，开启scrapyd服务。(如果scrapyd在远程服务器上已经部署成功了，那么是不需要再次进行开启的。一般远程服务器上的scrapyd会一直保持运行状态。)

再次刷新主机管理，scrapyd的连接状态变成normal即可。

四、在gerapy中部署爬虫项目

点击左侧的 Projects ，即项目管理选项。

2.将自己的爬虫项目，拷贝到gerapy目录下的projects目录下。

3.刷新浏览器页面，我们便可以看到 Gerapy 检测到了这个项目。

4.点击部署按钮进行打包和部署，在右下角我们可以输入打包时的描述信息，类似于 Git 的 commit 信息，然后点击打包按钮，即可发现 Gerapy 会提示打包成功，同时在左侧显示打包的结果和打包名称。

5.开始打包

6.打包完成以后，开始将爬虫项目部署到scrapyd服务上。

五,开始调度爬虫，检测爬虫的运行状态

1.部署完毕之后就可以回到“主机管理”页面进行任务调度。

2.选择要运行的爬虫项目

3.查看运行结果

猜你喜欢

转载自blog.csdn.net/weixin_42336579/article/details/81103681

Gerapy分布式爬虫管理框架

scrapyd部署、使用Gerapy 分布式爬虫管理框架

功能比Scrapy强大但使用却最方便的分布式爬虫管理框架——Gerapy

scrapy入门教程()Gerapy分布式爬虫管理框架

跟繁琐的命令行说拜拜！Gerapy分布式爬虫管理框架来袭！

gerapy+scrapyd组合管理分布式爬虫

分布式爬虫的部署之Gerapy分布式管理

Gerapy管理分布式Scrapyd

Scrapy项目部署到Gerapy分布式爬虫框架流程

Gerapy分布式部署

python下使用scrapy-redis模块分布式爬虫的爬虫项目部署详细教程————————gerapy

分布式通用爬虫框架Crawlab

基于scrapy框架的分布式爬虫

scrapy框架之分布式爬虫

支持多种语言框架的分布式爬虫管理平台，爬虫本应如此简单

Gerapy部署scrapy爬虫框架

分布式爬虫

爬虫分布式

akka分布式爬虫框架(一)——设计思路与demo

21天打造分布式爬虫-Scrapy框架（七）

Scrapy框架之基于RedisSpider实现的分布式爬虫

redis 分布式 1 爬虫scrapy框架之CrawlSpider

scrapy-redis分布式爬虫框架详解

Python scrapy框架教学（五）：分布式爬虫

scrapydweb的初步使用（管理分布式爬虫）

分布式爬虫管理平台Crawlab安装与使用

分布式管理

分布式爬虫与增量式爬虫

分布式服务框架 Zookeeper -- 管理分布式环境中的数据

【转】分布式服务框架 Zookeeper -- 管理分布式环境中的数据

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

周排行

让自己的头脑极度开放

CentOS 6.5(x64) 和Redhat6.5操作系误删libc

高可用注册中心

【日记】12.28/【题解】AtCoder AGC041

XML（5）_XML 约束_DTD

Java集合Map（四）

树梅派安装桌面环境教程

pipenv 的使用和安装

小程序白屏问题和内存研究

C语言简单选择排序

每日归档

更多

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)