反扒请求报错HTTP 599: SSL certificate problem 或者requests.exceptions.SSLError: HTTPSConnectionPool

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/ZHH_Love123/article/details/85234914

前提
有些网页,一开始用脚本语言(python)去访问的时候会遇到这样问题。 
一般这样的网站用浏览器去访问的时候,会弹出这样的警告“您的链接不是私密链接”。

内容大多出自于崔大神书籍。本菜结合书中内容做了自己的阐述。

简单解释
这里是由于这个网页的证书没有被官方CA机构信任,所以这里会出现证书验证的错误。 
这样的url典型有https://www.12306.cn

如下使用代码的时候,就会出现这样的问题。

import requests
r = requests.get('https://www.12306.cn')
print(r.status_code)


解决方法
第一种解决方法

解释:下面代码有点意思。一开始的时候写在pycharm上面显示的是错误的信息。但是运气起来却是没有问题的。 
下面代码调用了urllib3.disable_warnings()函数,来确保不会发生警告。

import requests
from requests.packages import urllib3
urllib3.disable_warnings()
r = requests.get('https://www.12306.cn', verify=False)
print(r.status_code)



如果不写 urllib3.disable_warnings(),看下面代码

import requests
# from requests.packages import urllib3
# urllib3.disable_warnings()
r = requests.get('https://www.12306.cn', verify=False)
print(r.status_code)


解决办法2:

import requests
import logging
logging.captureWarnings(True)
r = requests.get('https://www.12306.cn', verify=False)
print(r.status_code)

在pyspider中的解决方法
 

self.crawl(url, callback=self.index_page, validate_cert=False)

猜你喜欢

转载自blog.csdn.net/ZHH_Love123/article/details/85234914