【Scrapy 框架】「版本2.4.0源码」异常操作（Exceptions）详解篇

其他 2021-03-01 07:58:33 阅读次数: 0

全部源码解析文章索引目录传送门

【Scrapy 框架】版本 2.4.0 源码篇：全部配置目录索引

文章目录

内容介绍
常规异常操作

内容介绍

这是Scrapy中包含的所有例外及其用法的列表。

常规异常操作

关闭spider

exception scrapy.exceptions.CloseSpider(reason=‘cancelled’)

def parse_page(self, response):
    if 'Bandwidth exceeded' in response.body:
        raise CloseSpider('bandwidth_exceeded')

不关闭spider

exception scrapy.exceptions.DontCloseSpider

可以在spider_idle信号处理程序中引发此异常，以防止蜘蛛网被关闭。

放弃Item

exception scrapy.exceptions.DropItem

Item的pipline阶段必须引发的异常才能停止处理Item。

忽略请求

exception scrapy.exceptions.IgnoreRequest

调度程序或任何下载程序中间件均可引发此异常，以指示应忽略该请求。

未配置

exception scrapy.exceptions.NotConfigured

某些组件可以引发此异常，以指示它们将保持禁用状态。这些组件包括

Extensions
Item pipelines
Downloader middlewares
Spider middlewares

不支持

exception scrapy.exceptions.NotSupported

引发此异常以指示不支持的功能。

停止下载

exception scrapy.exceptions.StopDownload(fail=True)

从bytes_received信号处理程序中发出，指示不应再下载其他字节来进行响应。

如果fail=True（默认），则调用请求errback。响应对象可用作异常的response属性，该StopDownload异常又存储为value接收Failure对象的属性。这意味着在定义为的errback中，虽然可以访问响应。

def errback(self, failure)：
	failure.value.response

如果为fail=False，则调用请求回调。

猜你喜欢

转载自blog.csdn.net/qq_20288327/article/details/113523437

【Scrapy 框架】「版本2.4.0源码」异常操作（Exceptions）详解篇

【Scrapy 框架】「版本2.4.0源码」管道（Pipeline）详解篇

【Scrapy 框架】「版本2.4.0源码」设置（Settings）详解篇

【Scrapy 框架】「版本2.4.0源码」物品（Items）详解篇

【Scrapy 框架】「版本2.4.0源码」爬虫页（Spiders）详解篇

【Scrapy 框架】「版本2.4.0源码」Downloader 中间件（Downloader Middleware）详解篇

【Scrapy 框架】「版本2.4.0源码」Spider中间件（Spider Middleware）详解篇

【Scrapy 框架】「版本2.4.0源码」架构解析（Architecture overview）详解篇

【Scrapy 框架】「版本2.4.0源码」选择器（Selectors）详解篇

【Scrapy 框架】「版本2.4.0源码」链接提取器（Link Extractors）详解篇

【Scrapy 框架】「版本2.4.0源码」请求和回应（Requests and Responses）详解篇

【Scrapy 框架】「版本2.4.0源码」输出文件（Feed exports）详解篇

【Scrapy 框架】「版本2.4.0源码」物品管道（Item Pipeline）详解篇

【Scrapy 框架】「版本2.4.0源码」物品加载（Item Loaders）详解篇

Scrapy框架初级篇

爬虫Scrapy框架详解

Scrapy框架详解

爬虫框架 Scrapy 详解

爬虫框架 Scrapy 教程详解

scrapy框架的使用，内部详解

爬虫框架（Scrapy）安装详解

Python爬虫Scrapy框架详解

scrapy爬虫框架（四）：scrapy中 yield使用详解

Scrapy框架实战（三）：详解 Scrapy 的 Item Pipeline

Scrapy爬虫框架详解-----全面详解

python应用：爬虫框架Scrapy系统学习第一篇——xpath详解

Scrapy框架 Scrapy框架

python学习之scrapy框架篇

scrapy爬虫框架之理解篇

Scrapy爬虫框架之入门篇

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)