Python爬虫动态获取Cookie

安装扩展

由于动态获取cookie需要打开浏览器,所以我们先安装chrome的扩展,不是平常用的客户端,到下方链接处下载
chrome扩展下载地址(点击进入下载界面)
根据当前chrome版本来选择下载
在这里插入图片描述
之后根据系统选择对应版本
在这里插入图片描述
下载后解压,将chromedriver.exe复制到python目录下的Scripts文件夹内
在这里插入图片描述
完成上述步骤后我们来安装selenium库,cmd内键入

python -m pip install selenium

安装完成后我们可以打开一个浏览器测试一下

from selenium import webdriver
driver = webdriver.Chrome()
driver.get("http://www.baidu.com")

运行结果如下即成功
在这里插入图片描述

获取cookie

由selenium打开浏览器访问页面,并获取cookie

from selenium import webdriver
import json
import requests
import re
 
driver = webdriver.Chrome()
driver.get('https://www.baidu.com/')
Cookie = driver.get_cookies()
strr = ''
for c in Cookie:
    strr += c['name']
    strr += '='
    strr += c['value']
    strr += ';'
full_cookie = strr

优化操作

上面操作中打开了浏览器,并且没有关闭,我们可以尝试使用后台开启浏览器,并获取cookie后关闭后台的浏览器

chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--headless')
driver = webdriver.Chrome(chrome_options=chrome_options)
driver.get('https://www.baidu.com/')
time.sleep(3)#等待3秒保证cookie加载完毕,也可以自行写一个判断
Cookie = driver.get_cookies()
strr = ''
for c in Cookie:
	strr += c['name']
	strr += '='
	strr += c['value']
	strr += ';'
full_cookie = strr
driver.quit()#关闭后台浏览器

小结

这是小白为了获得动态cookie的权宜之计,可能很low,但目前的能力只能这样实现功能,望各位大佬多多指点。

猜你喜欢

转载自blog.csdn.net/Micrasoft007/article/details/109038857