Scrapy模拟登录小记

其他 2021-02-08 17:07:48 阅读次数: 0

Scrapy登录方式

方式一：直接携带cookie
方式二：找到发送post请求的URL地址，带上信息，发送请求

人人练习

创建爬虫项目

scrapy startproject renren

renrenlogin.py

# -*- coding: utf-8 -*-
import scrapy

from ..settings import DEFAULT_REQUEST_HEADERS

class RenrenloginSpider(scrapy.Spider):
    name = 'renrenlogin'
    allowed_domains = ['renren.com']
    start_urls = ['http://www.renren.com/269782969/profile']

    #重写父类的方法
    def start_requests(self):

        str_cookies = '{}'.format(cookies字符串)

        cookies = {
    
    }
        for i in str_cookies.split(';'):
            # print(i)
            # print(i.split('=')[0])
            # print(i.split('=')[1])
            cookies[i.split('=')[0]] = i.split('=')[1]
        #print(DEFAULT_REQUEST_HEADERS)
        #print(self.start_urls[0])
        print(cookies)
        yield scrapy.Request(
            url=self.start_urls[0],
            headers=DEFAULT_REQUEST_HEADERS,
            cookies = cookies,
            callback=self.parse
        )

    def parse(self, response):

        #print(response.text)
        with open('renren.html', 'w', encoding='utf-8') as f:
            f.write(response.body.decode())

猜你喜欢

转载自blog.csdn.net/Narutolxy/article/details/107180637

Scrapy模拟登录小记

scrapy(4)模拟登录

Scrapy模拟登录GitHub

scrapy模拟登录

scrapy模拟用户登录

Scrapy模拟表单登录

Scrapy--模拟登录

scrapy 模拟登录github

scrapy专题（十二）：scrapy 模拟登录

使用scrapy框架模拟登录

scrapy爬虫之模拟登录豆瓣

Scrapy从入门到精通(6）--模拟登录

scrapy 框架模拟登录_Request、Response

scrapy使用selenium模拟登录知乎

Scrapy笔记11- 模拟登录

利用 Scrapy 框架进行模拟登录

scrapy模拟登录值携带cookie

scrapy发起post请求,模拟登录github

scrapy知乎模拟登录和cookie登录

Scrapy中使用cookie免于验证登录和模拟登录

爬虫登录Django, scrf拦截, token验证, scrapy模拟登录

模拟小记

web爬虫讲解—Scrapy框架爬虫—Scrapy模拟浏览器登录—获取Scrapy框架Cookies

使用requests和scrapy模拟知乎登录

爬虫——三种Scrapy模拟登录方式

scrapy--模拟登录的三种方式

scrapy中模拟登录知乎【思路很优秀】

scrapy模拟登录知乎并获取知乎用户信息

8_3 scrapy模拟登录人人网

scrapy 登录

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)