scrapy 保存cookie - 代码天地

scrapy 保存cookie

其他 2018-07-16 05:15:20 阅读次数: 0

from scrapy.http.cookies import CookieJar    # 该模块继承自内置的http.cookiejar,操作类似

# 实例化一个cookiejar对象
cookie_jar = CookieJar()
real_cookie = {}
# 首先是cookie的提取
class MySpider(scrapy.Spider):
    ....
    ....
    # 模拟登陆,之后调用一个检查是否登录成功的函数
    def login(self, response):
        ....
        return [scrapy.FormRequest(
            url=login_url,
            formdata = {'username':xxx, 'password':xxx},
            callback = self.check_login
        )]
def save_cookie(self, cookie_jar):
        for cookie in cookie_jar:
            p = re.compile(r'<Cookie (.*?) for .*?>')
            cookies = re.findall(p, str(cookie))
            if '=' in cookies[0]:
                cookies = (cookie.split('=', 1) for cookie in cookies)
                tmp_dict = dict(cookies)
                for item in tmp_dict:
                    self.real_cookie[item] = tmp_dict[item]
def check_login(self, response):
    if 登录成功:
        # 到这里我们的登录状态已经写入到response header中的'Set-Cookies'中了,
        # 使用extract_cookies方法可以提取response中的cookie
        cookiejar.extract_cookies(response, response.request)
        self.save_cookie(cookiejar)

后面一些请求就可以带上这个cookie
scrapy.Request(url, callback=self.xxx, cookies=self.real_cookie)

http://www.waitingfy.com/archives/4623

猜你喜欢

转载自blog.csdn.net/fox64194167/article/details/81055327

scrapy 保存cookie

scrapy爬虫cookie设置

scrapy的CrawlSpider和cookie

笔记-scrapy-cookie

cookie转scrapy所用的

scrapy添加cookie

scrapy保存图片

scrapy保存数据

Scrapy设置cookie遇到的坑

Scrapy 发送带Cookie的请求

scrapy:get cookie from response

scrapy保存数据到文本

保存cookie

cookie保存

scrapy框架中cookie的设置路径

Scrapy 的headers中cookie不生效的问题

scrapy框架之cookie和代理操作

scrapy获取headers的set-cookie的坑

scrapy模拟登录值携带cookie

scrapy使用cookie的三种方式

Scrapy通过sqlite3保存数据

scrapy爬虫之item pipeline保存数据

Scrapy框架----pipeline---------数据保存EXCEL

scrapy数据保存为txt

scrapy把数据保存为txt形式

scrapy(blog)数据保存到MySQL

scrapy数据保存为excel

scrapy(微博)数据保存到Mongodb

scrapy保存到mysql数据库

Scrapy爬取并保存到TXT文件

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)