Scrapy----Scrapy架构及工作流程

企业开发 2023-04-08 11:52:14 阅读次数: 0

【原文链接】Scrapy----Scrapy架构及工作流程

一、Scrapy架构图

scrapy的架构图如下，红色箭头表示工作流程

二、Scrapy的组成

Scrapy Engine

Scrapy Engine主要用来协调数据流在Scrap各个组件之间工作的

Schedule
执行的调度器，简单点来说可以理解为一个队列
Downloader
下载器，简单点理解就是执行request的组件
Spiders
负责提供第一个url，并在后续response中解析新的需要请求的url
Item Piplines
负责对获取到的响应数据进行数据清洗，然后对数据进行存储，可以存储到多个中存储类型中看比如文件、数据库等

Scrapy主要就是这五个部分，当然还有一些中间件，主要在两个组件之间锁一些中间处理

三、Scrapy工作流程

（1）Spiders 将第一条url发送给Scrapy Engine

（2）Scrapy Engine把请求发送给Scheduler调度器

（3）Scheduler调度器调度好执行顺序后传递给Scrapy Engine

（4）Scrapy Engine根据Schedule的调度，将request请求发送给Downloader

（5）Downloader请求完成后，将请求结果返回给Scrapy Engine

（6）Scrapy Engine收到响应结果后，将响应结果传递给Spider，Spider可根据返回结果分析是否有新的的url传递给Scrapy 继续请求

（7）Spider将分析结果传递给Scrapy Engine

（8）Scrapy Engine将响应结果继续传递给Item Piplines供对响应数据进行清洗架构并存储

猜你喜欢

转载自blog.csdn.net/redrose2100/article/details/129221507

Scrapy----Scrapy架构及工作流程

scrapy工作流程

Scrapy 工作流程

scrapy 框架的工作流程

Scrapy数据流的工作流程

scrapy 原理图及工作流程

Scrapy的简介及工作流程讲解

Scrapy框架的学习(1.scrapy的概念以及scrapy的工作流程)

Learning Scrapy《精通Python爬虫框架Scrapy》 03：Scrapy的工作流程

爬虫之scrapy工作流程简单介绍

二十七、scrapy的概念和工作流程

Scrapy中的核心工作流程以及POST请求

scrapy核心组件工作流程和post请求

scrapy架构流程

scrapy框架-架构流程介绍

Docker架构与工作流程

Nginx的架构及工作流程

docker架构及工作流程

AutoGPT的架构及工作流程

scrapy流程

Scrapy架构

Scrapy 架构

浅谈SpringMVC之架构与工作流程

Hive的架构和工作流程

ansible架构原理及工作流程

Kubernetes架构和工作流程

【Scrapy-01】安装、创建项目、创建爬虫、简单爬取百度title的例子以及工作流程简介

Python_Scarapy_01_Scrapy架构流程介绍

【Python爬虫】Scrapy框架的核心架构和执行流程

python爬虫基础（13：Scrapy框架之架构流程与目录）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)