版权声明:本文章为沐言-BigTree原创,转载复制请标明出处 https://blog.csdn.net/u011318077/article/details/86538116
上接:
Python3网络爬虫教程6——cookie & session(cookie的属性,保存及模块的使用)
https://blog.csdn.net/u011318077/article/details/86538097
5. SSL数字证书
- SSL就是指遵守SSL安全套阶层协议的服务器数字证书(SecureSocketLayer)
- 理论上网址带有https:都是安全的,带有SSL数字证书
- CA(Certificate Authority) 是数字证书认证中, 发放管理废除数字证书的第三方机构
- 遇到不信任的SSL证书,需要进行单独处理
- 参考案例43_17
# 遇到不信任的SSL证书
# 如果要继续访问,则需要执行忽略处理
import ssl
from urllib import request
# 利用非认证的上下文环境替换认证的上下文环境
ssl._create_default_https_context = ssl._create_unverified_context
url = 'https://www.12306.cn'
rsp = request.urlopen(url)
html = rsp.read().decode()
print(html)
下接:
Python3网络爬虫教程8——有道在线翻译项目(JS加密)