scrapy多层爬取 - 代码天地

scrapy多层爬取

其他 2020-02-11 11:12:46 阅读次数: 0

想了很久最终还是决定把分层爬取加上
最关键的是这几行：

#获取详情页网址
security_item['url'] = i_item.xpath(".//div[@class='row2']/h3/a/@href").extract()[0]				
#跳转detail_parse方法，抓取数据以后返回					
yield scrapy.Request(security_item['url'],meta={'security_item':security_item},callback=self.detail_parse)

最后引入的detail_parse方法：

def detail_parse(self,response):
		security_item = response.meta['security_item']
		security_item['detail'] = response.xpath("//div[@class='mianLeft']/div[@class='de_p']").xpath('string(.)').extract()[0]
		return security_item

这样就完美解决啦！
给源代码截个图吧
在这里插入图片描述

发布了22 篇原创文章 · 获赞 18 · 访问量 7197

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43525427/article/details/97140370

scrapy多层爬取

Python Scrapy多层爬取收集数据

Scrapy 实现爬取多页数据 + 多层url数据爬取

scrapy框架循环多层页面爬取数据写入数据库或文档

scrapy爬取图片

scrapy 爬取图片

scrapy爬取jobbole

Scrapy爬取豆瓣

使用scrapy爬取

scrapy 爬取起点

scrapy 爬取小说

scrapy爬取京东

爬取股票scrapy

scrapy 爬取视频

scrapy增量爬取

scrapy爬取小说

scrapy 图片爬取多层多页保存不同的文件夹重命名full文件夹

scrapy 爬取写入MongoDB

scrapy(3)爬取图片

Scrapy爬取人人网

使用scrapy爬取网站

scrapy爬取趣头条

scrapy 爬取京东例子

Scrapy爬取图片教程

Scrapy框架：爬取博客

scrapy爬取豆瓣电影

scrapy爬取动态数据

scrapy爬取深度设置

Scrapy爬取静态页面

scrapy 爬取拉勾网

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)