python3 爬取网页的异常处理 - 代码天地

python3 爬取网页的异常处理

其他 2019-03-04 14:11:49 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/sinat_22659021/article/details/78503267

有时候python爬取的网页会出现异常，我们需要添加异常处理

我们主要说明一下URLError和HTTPError

参考博客：点击打开链接

URLError

首先解释下URLError可能产生的原因：

网络无连接，即本机无法上网
连接不到特定的服务器
服务器不存在

HTTPError是URLError的子类，在你利用urlopen方法发出一个请求时，服务器上都会对应一个应答对象response，其中它包含一个数字”状态码”，具体每个状态码代表什么可以去网上查到。

from urllib import request
from urllib import error

if __name__ == '__main__':
    target_url = 'http://www.dubai.com/'
    try :
        res = request.urlopen(target_url)
    except error.URLError as e:
        if hasattr(e,"code"):
            print(e.code)
        if hasattr(e,"reason"):
            print(e.reason)
        else:
            print("OK")

因为HTTPerror是URLerror的子类，所以也可以被URLError获取到，我们也可以分开获取，再写一个except error.HTTPError as e:

猜你喜欢

转载自blog.csdn.net/sinat_22659021/article/details/78503267

python3 爬取网页的异常处理

python3爬取网页图片

python3 爬取天气网页

python3爬虫爬取网页图片简单示例

python3爬虫之二：爬取网页图片

python3 爬取36氪新闻网页

Python3 -- 基于Splinter工具爬取网页资源

python3 从网页上爬取图片

python3 url 爬取网页并读写

Python3 爬取Ajax加载的网页信息

Python3 Ajax加载的网页爬取

python3定向爬取网页内容

python3 爬取网页表格例子

python3爬取网页图片路径并写入文件

python3爬取网页中的邮箱地址

Python3 使用request模块爬取网页的图片

Python3 使用urllib 爬取网页

python3 ：异常处理

python3的异常处理

Python3 异常处理

python3异常处理

python3异常

python3 异常

Python3——异常

Python3——爬取淘宝评论

python3爬取图片

python3爬取租房的信息

python3 爬取影像数据

python3 爬取API数据

使用Python3爬取美女

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)