《图解Http》第一章 了解 Web 及网络基础

引言

《图解http》是一本计算机网络入门非常好的书籍,书中图片生动形象,有助于理解Http协议和网络的组成,我认为书中比较重要的部分是http协议、http报文组成、http状态码和Https部分,书中也用较多的笔墨来描写,如果你也想快速入门计算机网络,可以阅读这一本不错的入门书籍,不喜欢读书的小伙伴也可以看看我的概括,希望我们可以一起学习进步。后续还会详述《Tcp/IP》。


第一章 Web 及网络基础

1.1 使用 HTTP 协议访问 Web

是否有人好奇过,在我们的浏览器中输入一个地址,回车以后就能转到我们想要到达的页面。

在这里插入图片描述

很显然,Web页面不会凭空产生,根据 Web 浏览器地址栏中指定的URL, Web 浏览器从 Web 服务器端获取文件资源(resource) 等信息, 从而显示出 Web 页面。

像这种通过发送请求获取服务器资源的 Web 浏览器等, 都可称为客户端(client) 。

在这里插入图片描述

Web 使用一种名为 HTTP(HyperText Transfer Protocol, 超文本传输协议 的协议作为规范, 完成从客户端到服务器端等一系列运作流程。 而协议是指规则的约定。 可以说, Web 是建立在 HTTP 协议上通信的。

Http诞生于1989年3月,CERN(欧洲核子研究组织) 的蒂姆 • 伯纳斯 - 李(Tim BernersLee)博士提出了一种能让远隔两地的研究者们共享知识的设想,最初设想的基本理念是: 借助多文档之间相互关联形成的超文本(HyperText) , 连成可相互参阅的 WWW(World Wide Web, 万维网)。

在这里插入图片描述

现在已提出了 3 项 WWW 构建技术, 分别是: 把SGML(Standard Generalized Markup Language, 标准通用标记语言) 作为页面的文本标记语言的 HTML(HyperText Markup Language, 超文本标记语言) ;作为文档传递协议的 HTTP ; 指定文档所在地址的 URL(Uniform Resource Locator, 统一资源定位符),后面会详细描述。


1.2 TCP/IP网络基础

1.2.1 TCP/IP 协议族

计算机与网络设备要相互通信, 双方就必须基于相同的方法。 比如,如何探测到通信目标、 由哪一边先发起通信、 使用哪种语言进行通信、 怎样结束通信等规则都需要事先确定。 不同的硬件、 操作系统之间的通信, 所有的这一切都需要一种规则。 而我们就把这种规则称为协议(protocol)。

在这里插入图片描述

像这样把与互联网相关联的协议集合起来总称为 TCP/IP。 也有说法认为, TCP/IP 是指 TCP 和 IP 这两种协议。 还有一种说法认为, TCP/IP 是在 IP 协议的通信过程中, 使用到的协议族的统称。

1.2.2 TCP/IP 的分层管理

TCP/IP 协议族里重要的一点就是分层。 TCP/IP 协议族按层次分别分为以下 4 层: 应用层、 传输层、 网络层和数据链路层。把 TCP/IP 层次化是有好处的。 比如, 如果互联网只由一个协议统筹, 某个地方需要改变设计时, 就必须把所有部分整体替换掉。 而分层之后只需把变动的层替换掉即可。 把各层之间的接口部分规划好之后, 每个层次内部的设计就能够自由改动了。

TCP/IP 协议族各层的作用如下。

  • 应用层:决定了向用户提供应用服务时通信的活动。TCP/IP 协议族内预存了各类通用的应用服务。 比如, FTP(FileTransfer Protocol, 文件传输协议) 和 DNS(Domain Name System, 域名系统) 服务就是其中两类。HTTP 协议也处于该层。

  • 传输层:传输层对上层应用层, 提供处于网络连接中的两台计算机之间的数据传输。在传输层有两个性质不同的协议: TCP(Transmission ControlProtocol, 传输控制协议) 和 UDP(User Data Protocol, 用户数据报协议)。

  • 网络层:用来处理在网络上流动的数据包。 数据包是网络传输的最小数据单位。 该层规定了通过怎样的路径(所谓的传输路线) 到达对方计算机, 并把数据包传送给对方。与对方计算机之间通过多台计算机或网络设备进行传输时, 网络层所起的作用就是在众多的选项内选择一条传输路线。

  • 链路层(又名数据链路层, 网络接口层):用来处理连接网络的硬件部分。 包括控制操作系统、 硬件的设备驱动、 NIC(Network Interface Card, 网络适配器, 即网卡) , 及光纤等物理可见部分(还包括连接器等一切传输媒介)。 硬件上的范畴均在链路层的作用范围之内。

在这里插入图片描述

利用 TCP/IP 协议族进行网络通信时, 会通过分层顺序与对方进行通信。 发送端从应用层往下走, 接收端则往应用层往上走。

我们用 HTTP 举例来说明, 首先,作为发送端的客户端在应用层(HTTP 协议) 发出一个想看某个 Web 页面的 HTTP 请求。接着, 为了传输方便, 在传输层(TCP 协议) 把从应用层处收到的数据(HTTP 请求报文) 进行分割, 并在各个报文上打上标记序号及端口号后转发给网络层。其次,在网络层(IP 协议) , 增加作为通信目的地的 MAC 地址后转发给链路层。 这样一来, 发往网络的通信请求就准备齐全了。接收端的服务器在链路层接收到数据, 按序往上层发送, 一直到应用层。 当传输到应用层, 才能算真正接收到由客户端发送过来的 HTTP请求。

发送端在层与层之间传输数据时, 每经过一层时必定会被打上一个该层所属的首部信息。 反之, 接收端在层与层传输数据时, 每经过一层时会把对应的首部消去。这种把数据信息包装起来的做法称为封装(encapsulate)。

在这里插入图片描述


1.3 与 HTTP 关系密切的协议 : IP、 TCP 和 DNS

1.3.1 负责传输的 IP 协议

IP 协议的作用是把各种数据包传送给对方。 而要保证确实传送到对方那里, 则需要满足各类条件。 其中两个重要的条件是 IP 地址和 MAC地址(Media Access Control Address)。

IP 地址指明了节点被分配到的地址, MAC 地址是指网卡所属的固定地址。 IP 地址可以和 MAC 地址进行配对。 IP 地址可变换, 但 MAC地址基本上不会更改。

在这里插入图片描述

1.3.2 确保可靠性的 TCP 协议

按层次分,TCP 位于传输层, 提供可靠的字节流服务。所谓的字节流服务(Byte Stream Service) 是指, 为了方便传输, 将大块数据分割成以报文段(segment) 为单位的数据包进行管理。 而可靠的传输服务是指, 能够把数据准确可靠地传给对方。 一言以蔽之,TCP 协议为了更容易传送大数据才把数据分割, 而且 TCP 协议能够确认数据最终是否送达到对方。

为了准确无误地将数据送达目标处, TCP 协议采用了三次握手(three-way handshaking) 策略。 用 TCP 协议把数据包送出去后, TCP不会对传送后的情况置之不理, 它一定会向对方确认是否成功送达。21握手过程中使用了 TCP 的标志(flag) —— SYN(synchronize) 和ACK(acknowledgement) 。

发送端首先发送一个带 SYN 标志的数据包给对方。 接收端收到后,回传一个带有 SYN/ACK 标志的数据包以示传达确认信息。 最后, 发送端再回传一个带 ACK 标志的数据包, 代表“握手”结束。若在握手过程中某个阶段莫名中断, TCP 协议会再次以相同的顺序发送相同的数据包。

在这里插入图片描述

1.3.3 负责域名解析的 DNS 服务

DNS(Domain Name System) 服务是和 HTTP 协议一样位于应用层的协议。 它提供域名到 IP 地址之间的解析服务。

计算机既可以被赋予 IP 地址, 也可以被赋予主机名和域名。 比如www.hackr.jp。

用户通常使用主机名或域名来访问对方的计算机, 而不是直接通过 IP地址访问。 因为与 IP 地址的一组纯数字相比, 用字母配合数字的表示形式来指定计算机名更符合人类的记忆习惯。

但要让计算机去理解名称, 相对而言就变得困难了。 因为计算机更擅长处理一长串数字。为了解决上述的问题, DNS 服务应运而生。 DNS 协议提供通过域名查找 IP 地址, 或逆向从 IP 地址反查域名的服务。

在这里插入图片描述

1.3.4 各种协议与 HTTP 协议的关系

学习了和 HTTP 协议密不可分的 TCP/IP 协议族中的各种协议后, 我们再通过这张图来了解下 IP 协议、 TCP 协议和 DNS 服务在使用HTTP 协议的通信过程中各自发挥了哪些作用。

在这里插入图片描述

1.3.5 URI 和 URL

与 URI(统一资源标识符) 相比, 我们更熟悉 URL(Uniform Resource Locator, 统一资源定位符)。 URL正是使用 Web 浏览器等访问 Web 页面时需要输入的网页地址。 比如, 下图的 http://hackr.jp/就是 URL。

在这里插入图片描述

URI 用字符串标识某一互联网资源, 而 URL 表示资源的地点(互联网上所处的位置) 。 可见 URL 是 URI 的子集。让我们先来了解一下绝对 URI 的格式。

在这里插入图片描述

  • 登录信息(认证):指定用户名和密码作为从服务器端获取资源时必要的登录信息(身份认证)。 此项是可选项。

  • 服务器地址:使用绝对 URI 必须指定待访问的服务器地址。 地址可以是类似hackr.jp 这种 DNS 可解析的名称, 或是 192.168.1.1 这类 IPv4 地址名, 还可以是 [0:0:0:0:0:0:0:1] 这样用方括号括起来的 IPv6 地址名。

  • 服务器端口号:指定服务器连接的网络端口号。 此项也是可选项, 若用户省略则自动使用默认端口号。

  • 带层次的文件路径:指定服务器上的文件路径来定位特指的资源。 这与 UNIX 系统的文件目录结构相似。

  • 查询字符串:针对已指定的文件路径内的资源, 可以使用查询字符串传入任意参数。 此项可选。

  • 片段标识符:使用片段标识符通常可标记出已获取资源中的子资源(文档内的某个位置) 。 但在 RFC 中并没有明确规定其使用方法。 该项也为可选项。

猜你喜欢

转载自blog.csdn.net/qq_36694674/article/details/106179546