Scrapy处理200-300范围之外的响应代码 - 代码天地

Scrapy处理200-300范围之外的响应代码

其他 2019-06-04 14:58:18 阅读次数: 0

HttpErrorMiddleware

类 scrapy.spidermiddlewares.httperror.HttpErrorMiddleware: 过滤掉不成功（错误）的HTTP响应，以便蜘蛛不必处理它们，这些（大多数时候）会产生开销，消耗更多资源，并使蜘蛛逻辑更复杂。

根据HTTP标准，成功的响应是那些状态代码在200-300范围内的响应。

如果您仍希望处理该范围之外的响应代码，则可以使用handle_httpstatus_listspider属性或HTTPERROR_ALLOWED_CODES设置指定spider能够处理的响应代码。

例如，如果您希望蜘蛛处理404响应，您可以执行以下操作：

class MySpider(CrawlSpider):

handle_httpstatus_list = [404]

 
  即在settings中增加HTTPERROR_ALLOWED_CODES = [403]， HTTPERROR_ALLOWED_CODES默认是[]  
 

所述handle_httpstatus_list的键Request.meta也可以被用于指定的响应代码，以允许在每个请求基础。您还可以设置meta键handle_httpstatus_all 来True，如果你想以允许请求的任何响应代码。

但请记住，处理非200响应通常是一个坏主意，除非你真的知道你在做什么。

猜你喜欢

转载自www.cnblogs.com/ltn26/p/10973442.html

Scrapy处理200-300范围之外的响应代码

打印200-300之间素数的小程序

输出200-300之间所有的素数；

200-300之间个位加十位等于10的数

网页错误代码200，300，400，500

HTTP响应状态代码----成功响应(200–299)

http statusCode(状态码) 200、300、400、500序列 201-206都表示服务器成功处理了请求的状态代码，说明网页

HTTP响应状态代码----重定向(300–399)

响应码200

一个或多个页边距被设置到也可打印的页面范围之外，处理方式

代码之外的生存指南

删除utf8范围之外的数据

http状态码200,300,404等

状态码200、300、400、500序列

scrapy 请求和响应

Scrapy解析响应数据

scrapy动态生成响应头

{width=200px;height=300px;overflow:hidden}

http statusCode(状态码) 200、300、400、500序列

600、000、002、200、300、400等开头的股票代表什么？

HTTP状态码100、200、300、400、500、600的含义

http状态码200，300，404大全

物料分类视图：200 和 300 分类测试记录

Ajax 响应码200，但回调error

angular中的异常机制与异常之外的处理

《软技能：代码之外的生存指南》

《软技能代码之外的生存指南》1

《软技能——代码之外的生存指南》笔记

软技能：代码之外的生存指南

《软技能代码之外的生存指南》反思

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

周排行

Metasploit文件目录与入侵基本概念

跨域(CORS)请求问题[No 'Access-Control-Allow-Origin' header is present on the requested resource]常见解决方案

CodeIgniter 源码解读之 CodeIgniter.php（二）

SAS入门之（四）改变数据类型

初识元组

[数学建模]数学建模算法和模型（B站视频）（二）

Nginx 服务器源码安装配置流程

C#实现语音视频录制【基于MCapture + MFile】

开发进度4

下载安装vue的方法网址

每日归档

更多

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)