Python爬虫：基础知识 - 代码天地

Python爬虫：基础知识

其他 2019-03-28 03:33:35 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/plychoz/article/details/88046587

http发送请求的方式
1、get请求
可带去参数给服务器，服务器返回完整的数据给我们
弊端：参数是明文，长度有限制

2、post请求
数据体没有限制
上传文件加密
服务器返回完整的数据给我们

3、put
4、delete
5、head

请求头信息：

Accept：文件格式
Accept-Encoding：编码格式
Connection：长链接keep-alive
Cookie：验证
Host：域名
Referer：标志从哪个页面跳转过来
User-Agent：存储了浏览器和用户的信息

爬虫
诸葛学院：互联网分析的平台
东湖大数据交易中心

爬虫价值：
1、买卖数据
2、数据分析数据分析报告
3、流量（引流，打广告）
4、阿里指数、百度指数（百度搜索风云榜）

爬虫的合法性：
1、灰色产业
2、没有法律规定合不合法
3、是否可以爬取所有的数据
（1）普通用户权限只能爬取非vip的视频
（2）vip客户权限可以爬取

重点：爬虫的工作原理
1、确认抓取目标的URL地址（自己找）
2、python的代码发送网络请求获取数据
3、解析获取到的数据（找新的目标url）
4、数据持久化

robots协议（是否允许其他爬虫）爬取某些内容
学习的是聚焦爬虫（不遵守robots协议）
爬虫和反爬虫作斗争，资源对等赢的永远是爬虫

猜你喜欢

转载自blog.csdn.net/plychoz/article/details/88046587

python爬虫基础知识

Python爬虫：基础知识

Python爬虫基础知识及前期准备

网络爬虫基础知识（Python实现）

Python爬虫之CSS基础知识

python 爬虫开发基础知识

python爬虫scrapy框架基础知识

Python 网络爬虫基础知识及体验

python爬虫基础知识的总结

Python爬虫基础知识：异常的处理

Python爬虫基础知识点

python爬虫1：基础知识

基础知识 - 爬虫

爬虫基础知识

爬虫的基础知识

爬虫_基础知识

python爬虫基础知识—03爬虫实例

Python爬虫之路-爬虫基础知识(理论)

Python基础知识回顾及scrapy框架爬虫基础

python基础整理6——爬虫基础知识点

【归纳】爬虫基础知识

爬虫必备基础知识

爬虫基础知识五

爬虫基础知识一

爬虫的基础知识（壹）

爬虫基础知识（叁）

爬虫基础知识（陆）

爬虫基础知识（捌）

爬虫基础知识（肆）

爬虫基础知识（伍）

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)