**Python 爬虫解决登录的问题** - 代码天地

Python 爬虫解决登录的问题

其他 2019-07-10 21:18:59 阅读次数: 0

一、使用cookie信息获取数据
复制已登录的cookie，使用这个cookie构建headers,请求url时携带headers（优点：简单粗暴缺点：具有时效性，超出时间需重新获取cookie）
二、硬登录（模拟登录获取数据）
1、使用requests （优点：速度快缺点：麻烦，要分析各个参数，对于加密或随机的参数较难实现）一般来说，分以下几步：
1）使用Session进行会话保持 sess = requests.Session(), 每次发送请求时都是用sess
2）获取验证码的图片，并下载到本地
3）识别验证码，给出结果
4）构造参数，携带参数用post请求访问登录的url
5) 访问要访问的url
注：有时可能会有一些隐藏的input框里面有参数
eg:
在这里插入图片描述

爬取github
2、使用selenium模拟登录（优点：简单方便，完全模拟用户登录网页的操作缺点：速度慢，对于大规模爬取效率低）
eg: python 模拟登录github

猜你喜欢

转载自blog.csdn.net/qq_42306041/article/details/91906492

**Python 爬虫解决登录的问题**

python 爬虫（三）cookie和session + 爬虫中使用cookie或session实现登录 + 代理的设置（解决ip被封问题）

Python爬虫编写乱码问题、验证码登录问题和IP代理问题解决

Python爬虫从入门到精通（六）表单与爬虫登录问题

Python爬虫从入门到精通（六）表单与爬虫登录问题

python爬虫自动登录验证码解决方案

Python:爬虫从这里开始----解决需要登录的网页

python爬虫自动解决字符编码问题

解决Python3 爬虫InsecureRequestWarning的问题

解决python爬虫中文乱码问题

如何解决python爬虫乱码问题

Python爬虫：解决SSL证书验证问题

python爬虫登录

python爬虫模拟登录

22-python爬虫解决gbk乱码问题 python爬虫解决gbk乱码问题

python爬虫--模拟12306登录

python爬虫登录爬取

Python(二) 爬虫 session 登录

Python爬虫之登录请求

Python3 爬虫--公司代理问题解决

python爬虫学习笔记（一）--解决乱码问题

【爬虫】python解决QQ邮箱查询接口的中文编码问题

python爬虫(八)-------------------Selenium主要解决js问题

Python爬虫总结——常见的报错、问题及解决方案

python爬虫中遇到的问题以及解决方法

python爬虫解决手机验证码问题

Python爬虫开发：https请求加密问题解决

web scraper无法解决爬虫问题？通通可以交给python！

Python爬虫学习环境配置之tesserocr安装的问题与解决

Python爬虫 - 解决动态网页信息抓取问题

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)