scrapy在Request之间传递参数 - 代码天地

scrapy在Request之间传递参数

其他 2018-09-27 18:57:52 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/showhilllee/article/details/72871141

我们在写爬虫的时候，经常会遇到这种情况，这里举例说明一下，比如爬一个新闻页面，首先爬的是新闻列表页pageA，从pageA里获取新闻详细页连接，然后爬新闻详情页pageB，新闻详情页pageB里有一个关于这个新闻的解说，在另一个页面pageC。这时候如果用传参的方法可以直接在爬取完成一条新闻的整个信息以后再把信息返回。
说明：
1、爬取列表信息的方法funcA
2、爬取新闻详情信息的funcB
3、爬取解说的funcC

 def parse(self, response):
     # collect `item_urls` 
     for item_url in item_urls:
         yield Request(url=item_url, callback=self.funcA)

 def funcA(self, response):
     item = MyItem()
     # 处理列表数据
     yield Request(url=item_details_url, meta={'item': item},
            callback=self.funcB)

 def funcB(self, response):
     item = response.meta['item']
     # 处理新闻详情页的数据
     yield Request(url=item_details_url, meta={'item': item},
            callback=self.funcC)

  def funcC(self, response):
     item = response.meta['item']
     # 处理新闻解说页的数据
     return item

注意：上面代码只是说明用法

PS. 传递多个参数：

yield Request(url, meta={'item': item, 'itemB': itemB, 'itemC':itemBC}, callback=self.parse)

取出多个参数。如果不同url过来的加上判断。（如针对分页）

           item = response.meta['item']
           itemB = response.meta['itemB']
           itemC = response.meta['itemC']

猜你喜欢

转载自blog.csdn.net/showhilllee/article/details/72871141

scrapy在Request之间传递参数

scrapy如何在Request之间传递参数

scrapy.Request() 的 meta参数数据的传递

python scrapy.Request传递给parse参数的方法

在Activity之间传递参数

网页之间的参数传递

视图之间的参数传递

页面之间传递参数

Activity之间参数传递

⑦ 路由之间传递参数

python——scrapy中Request参数

Spring中Model、ModelMap、ModelAndView、Request、Session之间的区别+传递参数

QTP的Action之间传递参数

Activity与Fragment之间传递参数

Vue路由之间的参数传递

Activity之间跳转并传递参数

Java 参数之间值得传递

scrapy 中request常用属性与参数

Scrapy Request和Response相关参数介绍

Scrapy Request和Response相关参数介绍

爬虫中scrapy.Request的更多参数

scrapy中Request请求使用Request payload参数

从request中传递过来的参数信息

Java获取request传递的所有参数

scrapy回调函数传递参数

Scrapy爬虫回调函数传递参数

js,jsp,java之间参数传递形式

使用Intent 在Activity 之间传递参数

Vue页面之间传递及接收参数方法

利用delegate进行ViewController之间的参数传递

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)