0301网络爬虫（1/7） - 代码天地

0301网络爬虫（1/7）

编程语言 2019-03-01 19:21:06 阅读次数: 0

一、Python的第三方库Requests

1、Requests是python公认的第三方优秀的网络爬虫库，通过这个库可以自动爬取HTML页面，自动进行网络内容请求的提交。

2、Requests库的七个主要方法：
在这里插入图片描述
3、requests库最常用的方法get方法

requests.get(url,params=None,**kwargs)

url:拟获取页面的url链接
params:url中额外参数，字典或字节流格式，可选
**kwargs:12个控制访问的参数。

如：使用requests用get方法向百度发出一个请求

在这里插入图片描述

如果断开网络，则会出现下面的错误信息。

二、请求头

1、http请求头，HTTP客户程序（例如浏览器），向服务器发送请求的时候必须指明请求类型（一般是GET或者POST）。如有必要，客户程序还可以选择发送其他的请求头。
2、类型：
Accept：客户机通过这个头，告诉服务器，它支持哪些数据类型
Accept-Charset：：客户机通过这个头，告诉服务器，它支持的编码
Accept-Encoding: 客户机通过这个头，告诉服务器，支持哪种数据压缩格式
Accept-Language: 客户机采用的是哪个语言
Host：客户机通过这个头，告诉服务器，想访问服务器哪台主机
If-Modified-Since：客户机通过这个头，告诉服务器，数据缓存的时间
Referer：客户机通过这个头，告诉服务器，客户机是从哪个页面来的（防盗链）
User-Agent: 说明客户机操作系统信息，以及浏览器信息
Cookie：客户机通过这个头，可以带点数据给服务器
Connection：表示是否需要持久连接。

猜你喜欢

转载自blog.csdn.net/Guiabbey/article/details/88053141

0301网络爬虫（1/7）

0302网络爬虫

python3网络爬虫第三章: Scrapy 爬虫框架 (1)

8.24网络爬虫笔记 -- Selenium

Python3.6网络爬虫

python入门18网络爬虫

python3网络爬虫——day1-1

Python3网络爬虫教程7——SSL数字证书

win7网络配置

CentOS7网络配置

【CentOS7网络配置】

设置CentOS7网络

javase--7网络编程

CentOS 7网络配置问题

Centos7网络异常

CentOS 7网络无法连接

centsOS 7网络配置

CentOS 7网络配置方法

Centos7网络设置

redhat7网络配置

CentOS 7网络配置

CentOS 7网络环境配置

配置centos7网络

python3网络爬虫学习——基本库的使用（1）

【笔记】1、初学python3网络爬虫——环境配置

python3网络爬虫——day1-2

python3网络爬虫——day2-1

Python3网络爬虫开发实战——第1章开发环境

从0到1学习Python3网络爬虫系列教程

【Python3网络爬虫开发实战】 1-开发环境配置

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)