Python学习之爬虫-爬虫的异常处理 - 代码天地

Python学习之爬虫-爬虫的异常处理

其他 2019-01-27 16:28:48 阅读次数: 0

Python学习之爬虫-爬虫的异常处理

概述：

爬虫在运行的过程中，很多时候都会遇到这样或那样的异常，如果没有异常处理，爬虫遇到异常时就会直接崩溃停止运行，下次再次运行时，又会重头开始，所以我们必须要对爬虫的异常进行处理，使之遇到异常后仍能继续运行下去。

常见的状态码即含义：

200：成功
301：重定向到新的URL，永久性
302：重定向到临时的URL，非永久性
400：非法请求
401：请求未经授权，没有权限访问
403：禁止访问
404：没有找到对应页面
500：服务器内部出现错误
501：服务器不支持实现请求所需的功能

URLError和HTTPError

两者的关系：HTTPError是URLError的子类。

区别：HTTPError有异常状态码与异常原因，URLError没有异常状态码。

使用注意：不能使用URLError直接代替HTTPError，如果要代替，必须要判断是否有状态码属性。

URLError出现的原因：

连不上服务器
远程url不存在
无网络
触发HTTPError

…

扫描二维码关注公众号，回复： 5091172 查看本文章

#异常处理
import urllib.request
import urllib.error

url = 'https://blog.csdn.net/'
try:
    data=urllib.request.urlopen(url).read().decode("utf-8")
    print(data)
except urllib.error.URLError as e:
    if hasattr(e,"code"):		# hasattr()判断是否用那某项属性
        print(e.code)
    if hasattr(e,"reason"):
        print(e.reason)

练习结果：

我擦，我这竟然可以把首页爬下来…
为得模拟出错，没法，只能把网络给断开，断开后就出现图2的情况
error练习

猜你喜欢

转载自blog.csdn.net/xxydzyr/article/details/86616701

Python学习之爬虫-爬虫的异常处理

python爬虫的异常处理

【Python爬虫】异常处理

python—【爬虫】学习_3(异常处理）

python学习之爬虫异常（三）

Python爬虫URLError异常处理

python_爬虫异常处理

python爬虫跳过异常处理

芝麻HTTP：Python爬虫入门之URLError异常处理

Python爬虫入门五之URLError异常处理

python爬虫之urllib,伪装,超时设置,异常处理

python爬虫学习3_urlLib异常处理

python网络爬虫学习笔记（四）：异常处理

Python编程学习之网络爬虫出现的异常种类

Python爬虫入门：URLError异常处理

Python爬虫基础知识：异常的处理

python爬虫系列：三、URLError异常处理

python爬虫--Urllib库与URLError异常处理

爬虫学习（六）————异常处理URLerrors异常处理

爬虫的异常处理（018）

爬虫的异常处理

爬虫异常处理

python学习之爬虫一

python爬虫之BeautifulSoup学习

python学习之爬虫技术

学习笔记之Python爬虫

python学习之天气爬虫

python学习之图片爬虫

python爬虫之Scrapy学习

初学Python之爬虫学习

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)