Python爬虫案例50篇-第1篇-csdn开源广场的cookie登录

其他 2021-11-16 13:24:42 阅读次数: 0

提前声明：该专栏涉及的所有案例均为学习使用，如有侵权，请联系本人删帖！

文章目录

一、请求头中的cookie
二、准备工作
三、分析
四、代码编写

一、请求头中的cookie

对于一些网站，我们在抓取时候需要补充请求头requests headers

Host: www.renren.com
Proxy-Connection: keep-alive
Pragma: no-cache
Cache-Control: no-cache
Upgrade-Insecure-Requests: 1
User-Agent: Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36 Core/1.70.3877.400 QQBrowser/10.8.4506.400
Accept: text/html
Accept-Encoding: gzip, deflate
Accept-Language: zh-CN,zh;q=0.9
Cookie: ***

但是对于一些网站，我们如果不登录，那么我们就无法进入网站内部，因此就需要登录，那么登录后，我们就可以获取到cookie值，而有了cookie值，我们就可以进入网站，抓取想要的信息。

二、准备工作

环境：python3.6
开发工具：pycharm
模块：requests

三、分析

网站：https://codechina.csdn.net/explore/welcome

进入网址，需要登录

在这里插入图片描述

因此我们需要手动登录后，然后看到已经有了cookie

在这里插入图片描述

在这里插入图片描述

因此我们直接在请求的时候携带自己的cookie，如果我们登陆后，可以看到自己的用户名

在这里插入图片描述

四、代码编写

# -*- coding: utf-8 -*-
import requests

url = 'https://codechina.csdn.net/explore/welcome'
headers = {
    
    
    'Cookie': '...',
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.25 Safari/537.36'
}
# 请求，verify=False 跳过ssl验证
response = requests.get(url, headers=headers, verify=False)
response.encoding = 'utf-8'
if '不愿透露姓名の网友' in response.text:
    print('cookie有效')
else:
    print('cookie无效')

在这里插入图片描述

成功！

猜你喜欢

转载自blog.csdn.net/qq_40558166/article/details/120723759

Python爬虫案例50篇-第1篇-csdn开源广场的cookie登录

Python爬虫案例50篇-第2篇-csdn开源广场中的session登录

Python爬虫案例50篇-第14篇-抓取CSDN作者周榜并发送到163邮箱

Python爬虫案例50篇-第24篇-使用feapder爬虫框架对runoob进行抓取

Python爬虫案例50篇-第10篇- 将爬虫抓取的数据存储到不同的地方

Python爬虫开发【第1篇】【多线程爬虫及案例】

Python爬虫开发【第1篇】【爬虫案例】

Python爬虫案例50篇-文章目录(更新至第13篇.....)

Python爬虫案例50篇-第22篇-有道翻译js加密

Python爬虫案例50篇-第8篇- 抓取某讯招聘的北京工作岗位

Python爬虫案例50篇-第18篇-最详细的的Fiddler抓包软件介绍

Python爬虫案例50篇-第4篇-搜狗图片爬虫（爬取美丽女孩子的图片）

Python爬虫案例50篇-第18篇-使用PySimpleGUI对视频爬虫做个可视化界面

python爬虫【第1篇】

Python爬虫案例50篇-第21篇-百度翻译js加密(加密参数sign)

Python爬虫案例50篇-第3篇-实现数据平台某瓜的自动化模拟登陆

Python爬虫案例50篇-第17篇-微信公众平台密码分析(深入md5加密)

Python爬虫案例50篇-第16篇-使用无头浏览器抓取博客园列表信息

Python爬虫案例50篇-第12篇-User-Agent大全和免费代网站大全

Python爬虫案例50篇-第11篇- 抓取免费代理IP并搭建自己的代理IP池

Python爬虫案例50篇-第9篇- 抓取B站迪迦奥特曼评论到Excel

Python爬虫案例50篇-第13篇-每日抓取疫情数据并使用钉钉机器人通知

Python爬虫案例50篇-第6篇-手把手教你把北京链家网爬虫修改为多线程爬虫（多线程版本）

Python爬虫案例50篇-第7篇-微博爬虫(抓取用户的微博信息并存储到csv表格)

Python爬虫开发【第1篇】【Requests】

Python爬虫开发【第1篇】【代理】

Python爬虫案例50篇-第5篇-手把手教你抓取北京链家网租房信息(单线程函数版本)

Python爬虫案例50篇-第16篇-万某网sign参数分析并模拟参数(探索md5加密)

Python爬虫案例50篇-第15篇-使用selenium+Chrome抓取某爱某家北京二手房标题

python爬虫【第2篇】

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)