scrapy请求发送解析 - 代码天地

scrapy请求发送解析

其他 2019-08-10 00:04:45 阅读次数: 0

scrapy自动发送请求

　　对start_urls列表中存储的起始url进行过请求的发送并没有通过手动实现，但是在parse函数中还是获取到了响应数据，这是因为爬虫文件中的爬虫类继承到了Spider父类中的start_requests（self）这个方法，该方法就可以对start_urls列表中的url发起请求：

1 def start_requests(self):
2         for u in self.start_urls:
3            yield scrapy.Request(url=u,callback=self.parse)

【注意】该方法默认的实现，是对起始的url发起get请求，如果想发起post请求，则需要子类重写该方法。

1 def start_requests(self):
2         #请求的url
3         post_url = 'http://fanyi.baidu.com/sug'
4         # post请求参数
5         formdata = {
6             'kw': 'wolf',
7         }
8         # 发送post请求
9         yield scrapy.FormRequest(url=post_url, formdata=formdata, callback=self.parse)

手动对需要获取的内容的url发起请求　　

1 #手动发起get请求，url指定，callback指定回调解析函数（可自定义），meta可以传递参数，封装在request中以便回调解析函数使用（request.item）
2 yield scrapy.Request(url=url,callback=self.parse1,meta={})
3 #手动发起post请求：formdata为请求参数，callback指定回调解析函数（可自定义），meta可以传递参数，封装在request中
4 yield scrapy.FormRequest(url=url,formdata=formdata, callback=self.parse2，meta={})

在请求中，cookie的处理是scrapy自动封装好的。

　　

猜你喜欢

转载自www.cnblogs.com/open-yang/p/11330098.html

scrapy请求发送解析

scrapy发送POST请求

scrapy发送翻页请求

scrapy之发送POST请求

Scrapy 发送带Cookie的请求

13.scrapy 框架之递归解析(手动发送请求)，

Scrapy 框架手动发送请求 POST 请求的发送

python使用scrapy发送post请求的坑

【Scrapy框架实现发送POST请求】

Scrapy 之如何发送post请求

scrapy递归解析和post请求

scrapy之发送POST请求（人人网简单登录）

如何利用scrapy发送post请求?(以微博为例)

二十九、scrapy构造并发送请求

Python 爬虫，scrapy，CrawlSpider，自动提取url并发送请求

scrapy-redis源码解读之发送POST请求

python基础编程：python使用scrapy发送post请求的坑

【python爬虫】scrapy入门8:发送POST请求

scrapy-redis爬虫如何发送POST请求

Flutter 发送json请求，并解析json数据

Scrapy 遇到的小坑_关于payload参数_scrapy第一次发送POST请求

python3_scrapy_Requests类解析（请求与回应）

Scrapy框架之递归解析和post请求

12.scrapy框架之递归解析和post请求

爬虫-scrapy框架之递归解析和post请求

scrapy框架的递归解析和post请求方式

03.scrapy框架之递归解析和post请求

Golang Web编程的Get和Post请求发送与解析

Java 发送SOAP请求调用WebService，解析SOAP报文

使用原生JS发送AJAX请求（XML，JSON解析）

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)