零基础入门Python,字节强力推荐Python编程:从入门到实践

 

第一部分 * 序章 * 网络爬虫基础

一.爬虫基本概述:

1.1:爬虫是什么?

1.2:爬虫可以干什么

1.3:爬虫的分类?

1.4:爬虫的基本流程

1.4.1:浏览网页的流程

1.4.2:爬虫的基本流程

1.5:爬虫与反爬虫

1.5.1:爬虫的功与防

1.5.2:常见的反爬与反反爬

1.6:爬虫的合法性与robots协议

1.6.1:robots协议

1.6.2:查看网页的robots协议

1.7:Python爬虫相关库

 

 

二.Chrome 浏览器开发者工具:

2.1:Chrome浏览器开发者简述

2.2:浏览器开发者工具版面说明

2.2.1:元素 (Elements) 面板

2.2.2:网络 (Network) 面板 (1)

2.2.3:网络 (Network) 面板 (2)

 

 

三.HTTP 协议

3.1 HTTP 简介

3.2 主要特点

3.3 URL,URI,URN

3.3.1 URI* 统一资源标识符

3.3.2 URL* 统一资源定位符

3.3.3 URN* 统一资源名称

3.3.4 URI,URL,URN 的区别

3.4 HTTP 协议与 HTTPS 协议

3.4.1 HyperText

3.4.2 HTTP 与 HTTPS

3.4.2 HTTP 与 HTTPS

3.5 HTTP 请求过程

3.5.1 General

3.5.2 请求方法 (Request Method)

3.5.3 状态码 (Status Code)

3.5.4 请求头信息 (Request Headers)

3.5.5 响应头信息 (Response Headers)

3.5.6 响应体 (Response Body)

3.6 Cookies 和 session

3.6.1 Cookies

3.6.2 session

3.6.3 Cookies 和 session 区别三

 

 

第二部分 * 初章 * 网络爬虫初识

一. 网络爬虫请求篇

4.1 requests 库简介

4.1.1 Requests 的安装

4.1.2 Requests 基本使用

4.1.3 Request 基本请求方式

4.2 使用 Request 发送 GET 请求

4.2.1 发送带 headers 的请求

4.2.2 发送带参数的请求

4.2.3 使用 GET 请求抓取网页

4.2.4 在 Headers 参数中携带 cookie

4.2.5 Timeout 设置

4.3 使用 Request 发送 POST 请求

4.3.1 POST 发送 JSON 数据

4.3.2 POST 上传文件

4.3.3 使用 POST 请求抓取网页

4.4 Requests 进阶 (1) * Session 会话维持

4.4.1 requests.session 的作用以及应用场景

4.4.2 requests.session 使用方法

4.4.3 使用 Session 维持 github 登录信息

4.5 Requests 进阶 (2) * 代理的使用

4.5.1 使用代理的过程

4.5.2 正向代理和反向代理

4.5.3 代理 ip(代理服务器)的分类

4.6 Requests 进阶 (3) * SSL 证书验证

4.7 Requests 库其他内容

4.7.1 查看响应内容

4.7.2 查看状态码与编码

4.7.3 发送 get 请求,并手动指定编码

4.7.4 chardet 库的使用

4.7.5 使用 detect 方法检测编码并指定

4.7.6 requests 库综合测试

 

 

一次偶然的机会,受朋友的邀请听了一次哈佛博士Python课程演讲感觉真的受益匪,很多东西讲得特别的透彻明了。事后朋友将这位教授亲授的Python教程600集+学习路线+练手项目发给了我,我现将这份落灰的资料给大家拿出来希望对你们学习有所帮助!

正文:视频资料+学习路线+练手项目

视频资料

学习路线

 

 70个Python项目:

 如果你思虑不周,你可能会认为编程仅仅是敲入一行行的程序语句而已

 

Guess you like

Origin blog.csdn.net/m0_63833811/article/details/121394931