scrapy-如何在CrawlSpider进行模拟登陆 - 代码天地

scrapy-如何在CrawlSpider进行模拟登陆

其他 2018-09-25 08:52:56 阅读次数: 0

因为CrawlSpider和Spider一样，都要使用start_requests发起请求，用从Andrew_liu大神借鉴的代码说明如何模拟登陆：

##替换原来的start_requests，callback为
def start_requests(self):
    return [Request("http://www.zhihu.com/#signin", meta = {'cookiejar' : 1}, callback = self.post_login)]
def post_login(self, response):
    print 'Preparing login'
    #下面这句话用于抓取请求网页后返回网页中的_xsrf字段的文字, 用于成功提交表单
    xsrf = Selector(response).xpath('//input[@name="_xsrf"]/@value').extract()[0]
    print xsrf
    #FormRequeset.from_response是Scrapy提供的一个函数, 用于post表单
    #登陆成功后, 会调用after_login回调函数
    return [FormRequest.from_response(response,   #"http://www.zhihu.com/login",
                        meta = {'cookiejar' : response.meta['cookiejar']},
                        headers = self.headers,
                        formdata = {
                        '_xsrf': xsrf,
                        'email': 'email',
                        'password': 'password'
                        },
                        callback = self.after_login,
                        dont_filter = True
                        )]
#make_requests_from_url会调用parse，就可以与CrawlSpider的parse进行衔接了
def after_login(self, response) :
    for url in self.start_urls :
        yield self.make_requests_from_url(url)

猜你喜欢

转载自blog.csdn.net/Keep_on_Growing/article/details/82795062

scrapy-如何在CrawlSpider进行模拟登陆

scrapy模拟登陆

scrapy 模拟登陆

三十、scrapy模拟登陆

scrapy 模拟登陆豆瓣

Scrapy 中的模拟登陆

我是如何实现用selenium进行模拟登陆的

scrapy爬虫之crwalspider模拟登陆

scrapy模拟登陆的几种方法

Scrapy模拟登陆豆瓣抓取数据

用scrapy实现模拟登陆

python 爬虫如何通过scrapy简单模拟登陆豆瓣网，手动进行图形验证码的验证

爬虫框架Scrapy（四）：Scrapy中的模拟登陆

使用selenium进行模拟登陆豆瓣

selenium抓取cookie进行模拟登陆

使用 selenium 进行模拟登陆

爬虫入门之scrapy模拟登陆(十四)

Scrapy 爬虫模拟登陆的3种策略

15.scrapy模拟登陆案例

三种scrapy模拟登陆方式

scrapy模拟登陆知乎--抓取热点话题

python之scrapy的FormRequest模拟POST表单自动登陆

python之scrapy模拟登陆人人网

scrapy模拟登陆人人网

scrapy模拟登陆强智教务系统

Scrapy实战之三种策略模拟登陆

scrapy中模拟登陆的三种实用方法

Python网络爬虫-7（Scrapy模拟登陆实战）

【重磅】SCRAPY+SELENIUM 模拟登陆CSDN

scrapy模拟登陆豆瓣网(处理验证码登陆)

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

基本数据类型封装类比较 Java源码解读(一) 8种基本类型对应的封装类型

JS实现无缝滚动上

深入解析HashMap原理（基于JDK1.8）

mysql的连接池

关于.htc

linux下的ubuntu12.04图形界面

【数论】好推不好记的扩展欧几里德

设备树详解

cscope + tags 简单设置

xml学习

每日归档

更多

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)