2_爬取网页的通用代码框架

其他 2020-08-12 08:57:55 阅读次数: 0

写在前面

网络连接有风险
异常处理需谨慎

理解Requests库的异常

requests.ConnectionError 网络连接错误异常，如DNS查询失败、拒绝连接等

requests.HTTPError HTTP错误异常

requests.URLRequired URL缺失异常

requests.TooManyRedirects 超过最大重定向次数，产生重定向异常

requests.ConnectTimeout 连接远程服务器时异常

requests.Timeout 请求URL超时，产生超时异常

r.raise_for_status() 如果不是200，产生异常requests.HTTPError

爬取网页的通用代码框架

import requests

def getHTMLText(url):
    try:
        r = rrquests.get(url,timeout=30)
        r.raise_for_status()#如果状态码不是200，引发异常HTTPError异常
        r.encoding = r.apparent_encoding
        return  r.text
    expect:
        return "产生异常"
if __name__ == "__main__":
	url = "http://www.baidu.com"
    print(getHTMLText(url))

猜你喜欢

转载自blog.csdn.net/qq_44105948/article/details/106228506

2_爬取网页的通用代码框架

python爬取网页的通用代码框架

python 爬取网页的通用代码框架

爬取网页的通用代码框架

人生苦短之爬虫爬取网页的通用代码框架

爬虫爬取网页的通用代码框架（附实例）

Python-爬取网页的通用代码框架

2.零基础系统学习Python爬虫之爬取网页的通用代码框架

网络爬虫之Requests库及爬取网页的通用代码框架

Python网络爬虫与信息提取（一）——Requests库的安装、Requests库的get()方法、爬取网页的通用代码框架

示例2_亚马逊商品页面爬取

python爬取网页基本框架

java代码实现网页源码爬取

java-实现网页代码的爬取

2_图片的批量下载和爬虫爬取图片数据集(20181218)

爬虫（爬网页）代码通用版本0.1

2_引入antd框架

学习使用Java的webmagic框架爬取网页内容

scrapy爬虫框架(四)-爬取多个网页

使用scrapy框架爬取网页图片——详解

python爬取网页

pyspider爬取网页

爬取静态网页

网页爬取

网页源码爬取

爬取网页图片

HttpClient爬取网页

Python2 urllib2爬取网页一简单爬取

爬虫简易入门代码-爬取简单网页图片

Python示例代码之爬取网页中的表格

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)