使用urllib下载数据时的证书验证失败以及403Forbidden错误 - 代码天地

使用urllib下载数据时的证书验证失败以及403Forbidden错误

其他 2020-04-30 11:59:10 阅读次数: 0

使用urllib下载数据

1、使用urllib.request向m.tianqi.com发送请求、获取该网站的响应
2、再使用Python的re模块来解析服务器响应、从中提取天气数据

import urllib.request, re

def get_html (city, year, month):
    url = 'https://m.tianqi.com/lishi/%s/%s%s.html' % (city, year, month)
    return urllib.request.urlopen(url).read().decode('UTF-8')
print(get_html('guangzhou','2018', '01'))

报错：

脚本提示证书验证失败

urllib.error.URLError: <urlopen error [SSL: CERTIFICATE_VERIFY_FAILED] certificate verify failed: unable to get local issuer certificate (_ssl.c:1108)>

解决方案：

在开头取消证书验证

# 全局取消证书验证

import ssl
ssl._create_default_https_context = ssl._create_unverified_context

再次运行程序，

报错：

urllib.error.HTTPError: HTTP Error 403: Forbidden

解决方案：

urllib.request.urlopen 方式打开一个URL,服务器端只会收到一个单纯的对于该页面访问的请求,但是服务器并不知道发送这个请求使用的浏览器,操作系统,硬件平台等信息,而缺失这些信息的请求往往都是非正常的访问,例如爬虫.

有些网站为了防止这种非正常的访问,会验证请求信息中的UserAgent(它的信息包括硬件平台、系统软件、应用软件和用户个人偏好),如果UserAgent存在异常或者是不存在,那么这次请求将会被拒绝(如上错误信息所示)

加上浏览器伪装就可以了。

import urllib.request, re
import ssl
ssl._create_default_https_context = ssl._create_unverified_context

def get_html (city, year, month):
    url = 'https://m.tianqi.com/lishi/%s/%s%s.html' % (city, year, month)
    requst = urllib.request.Request(url)
    # 设置一个User-Agent头，避免产生403错误
    requst.add_header('User-Agent', 'Mozilla/5.0')
    return urllib.request.urlopen(requst).read().decode('UTF-8')
print(get_html('guangzhou','2018', '01'))

问题成功解决。

fswy

原创文章 214 获赞 359 访问量 89万+

关注他的留言板

猜你喜欢

转载自blog.csdn.net/yxys01/article/details/104185118

使用urllib下载数据时的证书验证失败以及403Forbidden错误

403Forbidden 防火墙拦截

解决nginx 403forbidden问题

使用wget或curl时 error 403 forbidden

Linux下Nginx访问web目录提示403Forbidden

记录解决phpStudy报出403Forbidden问题的方法

python使用urlopen/urlretrieve下载文件时出现403 forbidden的解决方法【转载】

python使用urlretrieve下载文件时出现403 forbidden的解决方法（反爬虫）

403 forbidden错误

android 源码下载403 forbidden, 406 not acceptable 错误

伪装浏览器失败urllib.error.HTTPError: HTTP Error 403: Forbidden

urllib.error.HTTPError: HTTP Error 403: Forbidden错误引发的原因

nginx 403 forbidden错误的解决

Apache下403 Forbidden错误

nginx出现403 Forbidden错误

nginx报403 Forbidden错误

python测试开发django-66.图片403forbidden

注册时填错验证码却没有提示？？？以及 403错误。

Django中使用ajax post向后台传送数据时403 Forbidden (CSRF token missing or incorrect.):的解决办法

wvp避坑指南(1)，总有一款适合你：DateUtil类Instant.from报日期转换错误 | zlm仍在线，点播超时 | 前台编辑、删除、新增操作无效 |浏览器403forbidden 打包报错

网站出现403 Forbidden错误的原因以及怎么解决的方法

HTTP 403 错误 – 禁止访问 (Forbidden)

关于svn报 403 Forbidden错误

Apache2 403 Forbidden错误

apache 403错误 Forbidden解决方法

python爬虫出现HTTPError ：403：forbidden错误！

Nginx 403 Forbidden错误的解决方法

ubuntu wget ERROR 403: Forbidden 错误

配置wordpress时出现403 Forbidden

访问前端时，报403 Forbidden问题

今日推荐

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

周排行

阿里云短信服务平台注册

Windows下的字符串处理(1)

sqoop: mysql导入数据到hdfs, hive, hbase

commons.lang中常用的工具类

离线安装PostgreSQL11.6

使用PyTorch简单实现卷积神经网络模型

一文彻底搞定谱聚类

一道面试题引发的血案

One Chat for Mac(聊天工具)

TCP/IP的底层队列是如何实现的？

每日归档

更多

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)