爬虫学习笔记-requsets的基本知识。 - 代码天地

爬虫学习笔记-requsets的基本知识。

编程语言 2020-03-01 19:01:16 阅读次数: 0


```python
r=requests.get(url,params=None,**kwargs)

其中：
r为response,即get请求返回的响应。
`r.status_code`  :HTTP请求的返回状态，200表示成功，404表示失败（只要不是200，都表示失败）
`r.text`: 相应内容的字符串形式。
`r.encoding`:猜测的编码形式
`r.apparent_encoding`:系统判断的编码形式，若headers中不存在charset，则默认为ISO-8859-1.

出现的异常：
requests.ConnectionError:网络链接错误异常，如DNS查询失败，拒绝连接等。
requests.HTTPError:HTTP错误异常。
requests.URLRequired:URL缺失异常。
requests.TooManyRedirects:超过最大重定向次数。
requests.ConnectTimeout:；连接远程服务器超时异常。
requests.Timeout:请求url超超时。

r.raise_for_status():如果状态码不是两百，产生异常requests.HTTPError，一般在try.except框架使用这个。

HTTP协议：无状态请求协议。
url格式：Http://host[:port][path]。
host:合法的Internet主机域名或IP地址。
port：端口号，缺省为80。
path:请求资源的路径。

PATCH，仅向url提交局部更新请求，可以节省网络带宽。
PUT，未提交字段被删除

headers字段：模拟浏览器访问。
auth：元组
cookies：网页特殊认证码
files：字典类型，传输文件
timeout：设定超时时间
proxies：设定访问代理服务器
allow_redirects：重新定向开关
Stream：获取内容立即加载开关
verify：认证SSL证书
cert：本地SSL证书

爬虫限制：
1.来源审查，判断User-Agent进行限制
2.Robots协议，告知爬取策略，要求遵守。使用方法：在网站主域名后加/robots.txt。

weixin_43960465

发布了8 篇原创文章 · 获赞 4 · 访问量 154

私信关注

猜你喜欢

转载自blog.csdn.net/weixin_43960465/article/details/104597325

爬虫学习笔记-requsets的基本知识。

爬虫的基本知识

requsets库学习笔记

http学习笔记（一）基本知识

Swift学习笔记-基本知识

JavaScript 学习笔记二：基本知识

Docker学习笔记_Dockerfile基本知识

【Lehr】Servlet基本知识学习笔记

WebRTC传输基本知识——学习笔记

Python学习笔记-PyQt基本知识

python爬虫基本知识

python—【爬虫】学习_1(基本知识篇）

爬虫基本知识及简单生成爬虫

爬虫_requsets

机器学习笔记（一）：机器学习基本知识概述

makefile笔记-基本知识

通讯基本知识（笔记）

python学习笔记和心得----基本知识（四）--元组

python学习笔记和心得----基本知识（三）--列表

python学习笔记和心得----基本知识（一）

Nginx学习笔记（一） nginx基本知识

学习笔记之-字符串的基本知识

Java学习笔记（一）：Java基本知识

Java学习笔记（六）：Java基本知识-数组排序

Java学习笔记（五）：Java基本知识-数组

小白的LSTM学习笔记（2）---门结构的基本知识

JavaScript基本知识——学习笔记之数组api总结

学习笔记 - pandas: 数据结构基本知识

STM32学习笔记(八)---通讯基本知识

node模块化开发基本知识学习笔记

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)