问题[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to...

其他 2019-12-19 13:50:53 阅读次数: 0

原因是二次解析的域名被过滤掉了，

解决办法

解决办法一：

yield scrapy.Request(url=detail_url, meta={'item': item}, callback=self.parse_info, dont_filter=True)

原理：忽略allowed_domains的过滤

解决办法二：

将allowed_domains = ['www.zhenai.com'] 更改为allowed_domains = ['zhenai.com'] ，即更换为对应的一级域名

猜你喜欢

转载自www.cnblogs.com/luoluosha/p/12067222.html

问题[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to...

scrapy_ [scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to ’XXXX‘

python爬虫scrapy框架今天踩得坑([scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to 'jobs.5)

DEBUG: Filtered offsite request to

昨天一个同事代码中报错[scrapy.spidermiddlewares.offsite] DEBUG: Filtered offsite request to

scrapy DEBUG: Filtered offsite request to 'news.cnblogs.com'

Filtered offsite request to 错误

scrapy_redis分布式爬虫遇到的问题DEBUG: Filtered offsite request to

scrapy爬虫程序的Filtered offsite request to "xxxxx.com"的错误

scrapy-redis显示 Filtered offsite request to 错误

scrapy 爬网站显示 Filtered offsite request to 错误.

scrapy 迭代爬取时，报错 Filtered offsite request

scrapy-yield scrapy.Request()不执行、失效、Filtered offsite request to错误 [转]

scrapy 爬取数据递归回掉出错错误日志【Filtered offsite request to】

关于[scrapy] DEBUG:Filtered duplicate request:

Python中Filtered offsite request to 'www.sohu.com':报错的解决方法

关于[scrapy] DEBUG:Filtered duplicate request: (dont_filter=True)

Filtered request failed

scrapy 爬虫中间件-offsite和refer中间件

Filtered request failed with root cause java io OptionalD

安装Anaconda的问题，ERROR:Due to...

【已解决】前端到后端400错误（The server cannot or will not process the request due to...）

Elasticsearch 6.2.3版本 filtered 报错问题 no [query] registered for [filtered]

eclipse安装插件的时候出现cannot connect to...的问题

解决gitbash中 failed to push some refs to...问题

Myecplise Debug模式查看request的请求参数

IDEA中debug查看request的parameter

debug 问题

spring mvc在debug模式下产生的问题Spring MVC报异常：org.springframework.web.util.NestedServletException: Request p

OData debug - Java client - why my batch request fails

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)