requests库总结及网络基础知识

截图来源于MOOC嵩天老师爬虫教程

requests基本框架

在这里插入图片描述
1.if name == __main__语句:
https://blog.csdn.net/Q2605894893/article/details/82345814
https://blog.csdn.net/qq_27017791/article/details/80212016
2.try except语句:只要有一句错误,就会执行except语句
3.模块化编程原则:函数化,方便调用,简洁,明晰功能:对比
在这里插入图片描述

基本方法,对象,属性,异常

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
1.Response对象包含服务器返回的所有信息——并将这些信息整合赋予自己的属性(encoding, text等) 也包含request的所有信息。
2.对大型资源:head方法用很少的宽带资源获取头部的主要信息和概要信息
3.对小型资源:get直接获取所有资源


HTTP网络基础

  1. HTTP是基于web端的数据通信的传送协议:传递数据和资源,资源包括HTML,文件,图片,视频等等。HTTP 协议架构在 TCP 协议之上,它规范了传输数据的内容和格式,特点:请求响应模式,无状态
  2. HTTP协议采用URL作为定位网络资源的路径(类比本地文件的路径目录)
    URL格式:http://域名(www.,com,edu…前后缀)【PATH—具体路径,从/后开始】
    例如:http://www.baidu.com(域名)/bit_clearoff//carticle(path网络资源具体路径)
    3. HTML: HTML(Hyper Text Mark-up Language )超文本标记语言,是用来修改,建造网页的语言:基于web的语言。包含head,body两大部分
    HTML是网页内容的载体。内容就是网页制作者放在页面上想要让用户浏览的信息,可以包含文字、图片、视频等。

学习web前端开发基础技术需要掌握:HTML、CSS、JavaScript语言。下面我们就来了解下这三门技术都是用来实现什么的:
3. HTML是网页内容的载体。内容就是网页制作者放在页面上想要让用户浏览的信息,可以包含文字、图片、视频等。
4. CSS样式是表现(外观控制)。就像网页的外衣。比如,标题字体、颜色变化,或为标题加入背景图片、边框等。所有这些用来改变内容外观的东西称之为表现。
5. JavaScript是用来实现网页上的特效效果。如:鼠标滑过弹出下拉菜单。或鼠标滑过表格的背景颜色改变。还有焦点新闻(新闻图片)的轮换。可以这么理解,有动画的,有交互的一般都是用JavaScript来实现的。


http通过URL对资源进行定位,通过6个常用方法对资源进行管理,每次操作都是独立无状态的。在http中,网络通道和服务器都是黑盒子,只能看到URL链接和对URL的操作。
爬虫爬取的用text显示的即html语言文本。

发布了54 篇原创文章 · 获赞 1 · 访问量 2741

猜你喜欢

转载自blog.csdn.net/weixin_44682507/article/details/101865324
今日推荐