request处理cookie的两种方法

       有些http请求后台接口时,需要加headers,不加会报错。有些是不需要的。这个要看后台是怎么校验的。可以先发一个不带hearders的请求测试下,能得到预期的结果就不需要加headers。

       python提供了一个非常强大的第三方库requests处理http协议。今天讲的重点就是如何使用requests处理cookie。cookie使用场景:访问需要登录才可见的页面。那如何获取到cookie?获取到cookie后又怎么使用cookie呢?

一、获取cookie

#导入requests包
import requests

targetURL = '目标网站地址'

#设置头UA
headers = {"User-Agent":"Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.132 Safari/537.36"}

#开启一个session会话
session = requests.session()

#设置请求头信息
session.headers = headers

#申明一个用于存储手动cookies的字典
manual_cookies={}

##打开手动设置的cookies文件
#部分网站需要滑动验证,这里通过浏览器登录成功后获取cookies手动存到文本来绕过验证,后续cookies自动更新
with open("manual_cookies.txt",'r',encoding='utf-8') as frcookie:
    cookies_txt = frcookie.read().strip(';')  #读取文本内容
    #手动分割添加cookie
    for item in cookies_txt.split(';'):
        name,value=item.strip().split('=',1)  #用=号分割,分割1次
        manual_cookies[name]=value  #为字典cookies添加内容

#将字典转为CookieJar:
cookiesJar = requests.utils.cookiejar_from_dict(manual_cookies, cookiejar=None,overwrite=True)

#将cookiesJar赋值给会话
session.cookies=cookiesJar

#向目标网站发起请求
res = session.get(targetURL)

#将CookieJar转为字典:
res_cookies_dic = requests.utils.dict_from_cookiejar(res.cookies)

#将新的cookies信息更新到手动cookies字典
for k in res_cookies_dic.keys():
    manual_cookies[k] = res_cookies_dic[k]

print(manual_cookies)

#重新将新的cookies信息写回文本
res_manual_cookies_txt = ""

#将更新后的cookies写入到文本
for k in manual_cookies.keys():
    res_manual_cookies_txt += k+"="+manual_cookies[k]+";"

#将新的cookies写入到文本中更新原来的cookies
with open('manual_cookies.txt',"w",encoding="utf-8") as fwcookie:
    fwcookie.write(res_manual_cookies_txt);

  •        自动获取,先写登录方法,等登录成功后从response报文中得到cookie。有些登录很简单,只需要用户名,密码就可以。有些登录还有验证码,有验证码的登陆可以验证码自动识别的方式获取。当然,有验证码的登陆,有些也可以直接使用cookie来绕过验证码。这种方式就必须熟悉cookie怎么用。

二 、使用cookie

方法一: 

# cookies是字典格式,这种cookie不能放在headers里

cookies = {

      name1 :value1,

      name2:value2

}

response = request.post(url, data=data, cookies=cookies)

方法二:使用requests.session, 通过CookieJar来处理cookie。

session = requests.session()

# cookie处理,将字典类型的cookie转换成cookiejar,由session自动处理cookie,报文请求的时候就不需要再加上cookie了。见上面的例子,已经写的很详细了,不需要再写了

方法三,headers中加cookie。

headers = { 

'User-Agent':'Apache-HttpClient/4.5.2 (Java/1.8.0_66)',

'cookie':'_zap=191e4816-acf0-41ab-85ca-c54c2ff9ca1f; d_c0="ABCsEEAYPQ2PTofKIlzwxMJDdb8R-_6iVQA=|'

}

response = requests.post(url,data=data,headers=headers)

猜你喜欢

转载自blog.csdn.net/sunny_happy08/article/details/83507873
今日推荐