Scrapyd的安装及使用 - 代码天地

Scrapyd的安装及使用

编程语言 2018-07-20 13:38:41 阅读次数: 0

前言:scarpy是一个爬虫框架, 而scrapyd是一个网页版管理scrapy的工具, scrapy爬虫写好后，可以用命令行运行，但是如果能在网页上操作就比较方便. scrapyd就是为了解决这个问题，能够在网页端查看正在执行的任务，也能新建爬虫任务，和终止爬虫任务，功能比较强大. 还有一个更加强大的国产工具 gerapy!

1.需要进入到你的虚拟环境中安装

scrapyd=1.2.0 scrapyd-client==1.2.0a1 mmh3=2.5.1

pip install scrapyd

pip install scrapyd-client==1.2.0a1

下载后会多个这

下载mmh3可能会遇到的问题

解决方案参考文档http://www.mamicode.com/info-detail-2351094.html

解决方法

将上面这两个放到

下面后

同理将上面2个文件放到你的虚拟环境中的site-packages里

出现下图所示即为成功

2.去该地址https://github.com/liyaopinner/BloomFilter_imooc下载py_bloomfilter.py

3.启动scrapyd服务

4.配置爬虫项目

5.开始向scrapyd中部署项目

(1)通过scrapyd-deploy命令测试scrapyd-deploy是否可用。

如果出现下图所示的错误,你需要根据提示的路径找到对应的文件,并修改即可.

如果是下图,则为成功

(2)scrapyd-deploy -l查看当前可用于部署到scrapyd服务中的爬虫有哪些。

参数1： [deploy: jobbole]

参数2： scrapy.cfg文中中的url

(3)命令scrapy list用来查看当前项目中，可用的爬虫。

如果出现下图所示的错误,只需根据提示更改即可

如果是下图,则为成功

(4)列举scrapyd服务中已经部署的爬虫项目：

ScrapydAPI: https://scrapyd.readthedocs.io/en/latest/api.html

如果是下图所示,则为成功

如果出现下图的错误

你需要到Curl下载官网: https://curl.haxx.se/download.html

curl配置说明参考文档:https://www.cnblogs.com/zhuzhenwei918/p/6781314.html

(5)添加版本:

(6)启动一个爬虫(调度爬虫项目)

可以点击Log查看运行情况

(7)取消爬虫运行

猜你喜欢

转载自blog.csdn.net/qq_38661599/article/details/81105910

Scrapyd的安装及使用

scrapyd安装

scrapyd的使用

00006__scrapyd windows环境下安装和使用

scrapyd和scrapyd-client使用教程 scrapyd中文介绍

芝麻HTTP:Scrapyd的安装

scrapyd的安装和部署

Scrapyd API的安装

Scrapyd-Client的安装

Scrapyd的安装与部署

Scrapyd 使用详解

使用scrapyd 部署爬虫

scrapyd使用教程

安装完scrapyd-client后使用scrapyd-deploy时出现无法正常运行的情况的解决

在linux下安装并运行scrapyd 在linux下安装并运行scrapyd

scrapyd

python核心编程：Scrapyd的安装

芝麻HTTP： 1.9.3-Scrapyd-Client的安装

window下scrapyd-client安装的问题

window环境下安装配置scrapyd

scrapyd 爬虫服务的安装与项目部署

[scrapyd] 使用web UI管理爬虫项目

windows中使用scrapyd遇到的问题

使用Scrapyd远程控制爬虫

scrapyd和scrapydweb使用详细教程

windows下安装后scrapyd-client 后，无法启动scrapyd-deploy

Anaconda安装以及scrapy框架和scrapyd的安装

scrapy学习第四篇：windows下安装scrapyd

scrapyd部署、使用Gerapy 分布式爬虫管理框架

win10如何使用scrapyd部署爬虫

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)