从零开始的计网学习——应用层（万维网、HTTP、SMTP协议）

文章目录

6.1 应用层概述

应用层解决通过应用进层的交互来实现特定网络应用的问题

在这里插入图片描述

应用层是计算机网络体系结构的最顶层，是设计和建立计算机网络的最终目的，也是计算机网络中发展最快的部分

应用层主要有以下应用：
应用层应用

例如：
输入域名将网页数据显示在浏览器中

这就是一种万维网WWW应用，使用的是应用层的超文本传输协议HTTP。

用户在浏览器地址栏中输入的是见名知意的域名，而TCP/IP的网际层使用IP地址来表示目的主机，从域名到IP地址的转换，由属于应用层范畴的域名系统DNS，在后台帮用户完成

其他应用：

6.2 客户服务器(C/S)方式和对等(P2P)方式

网络应用程序运行在处于网络边缘的不同段的系统上，通过彼此间的通信来完成某项任务
开发一种新的网络应用给首先要考虑的问题就是网络应用程序在各种端系统上的组织方式和他们之间的关系

目前流行的两种方式是：

客户/服务器(Client/Server,C/S)方式
对等方式（Peer-to-Peer，P2P）方式

客户/服务器(Client/Server,C/S)方式

客户和服务器指的是通信中所设计的两个应用进程
客户/服务器方式所描述的是进程之间服务和被服务的关系
客户是服务请求方，服务器是服务提供方
服务器总是处于运行状态的，并且等待计算机的服务请求。
服务器有固定端口号（如HTTP服务器的默认端口是80）,而运行服务器的主机有固定的IP地址

CS姚迪安

C/S方式示例：
CS方式示例

对等方式（Peer-to-Peer，P2P）方式

在P2P方式中，没有固定的服务请求者和服务提供者，分布在网络边缘各端系统中的应用程序是对等的，被称为对等方。
对等方之间直接通信，每个对等即是服务的请求者，又是服务的提供者
目前在因特网上流行的P2P应用主要包括P2P文件共享、即时通信，P2P流媒体、分布式存储等。
基于P2P应用是服务分散型的，因为服务不是集中在少数几个服务器计算机中，而是分散在大量对等计算机中。这些计算机不为服务提供商所有，而是个人控制的桌面计算机和笔记本电脑，通常位于住宅、校园和办公室中
P2P的最突出的特性之一就是他的可扩展性。因为系统的每增加一个对等方，不仅增加的是服务的请求者，同时也增加了服务的提供者，系统性能不会因为规模的增大而降低

P2P应用示例：

6.3 动态主机配置协议DHCP

互联网广泛使用的动态主机配置协议 DHCP (Dynamic Host Configuration Protocol) 提供了即插即用连网 (plug-and-play networking) 的机制。
这种机制允许一台计算机加入新的网络和获取 IP 地址，而不用手工配置。

我们进行举例说明DHCP的作用：
没有DHCP的情况

在没有DHCP时，我们需要手动给每台主机设计IP地址、子网掩码、默认网关等数据。

当网络中主机较多时，手工配置的工作量大，并且容易出错。

当在网络中设置DHCP服务器后：
引入DHCP服务器

在引入DHCP服务器后，网络中各主机开机后自动启动DHCP程序，向DHCP服务器请求自己的网络配置信息。

此时网络中各主机就可以通过DHCP自动获取网络配置信息。

DHCP的运行过程：

DHCP 使用客户 - 服务器方式
DHCP在运输层使用UDP协议，DHCP 服务器运行在 67 号端口， DHCP客户运行在 68 号端口

用两个服务器，一个客户端举例。

客户端广播DHCP发送报文

由于此时客户端还没有设置地址，此时将源地址设置为0.0.0.0，目的地址设置为广播地址255.255.255.255,目的端口设置为67（DHCP服务器端口）

除了DHCP服务器外，其他进程不能接收该UDP报文（其他接收端口不是67）

在DHCP发送报文中格式比较复杂，只需要知道其内部有事务ID和DHCP客户端的MAC地址。

由于DHCP服务器进程是一直运行的，当收到DHCP发送报文后，会根据其MAC地址在自己的数据库查找，若数据库中有该MAC地址的配置信息，则用这些配置信息来构建发送报文。若没有，则采用默认信息来构建并发送DHCP报文。

DHCP服务器接收报文后返回DHCP提供报文：

源地址设置为服务器地址，由于此时客户端还没有设置地址，此时将，目的地址设置为广播地址255.255.255.255（只有广播地址能使其接到）,目的端口设置为68（DHCP客户端端口）

除了DHCP客户端外，其他进程不能接收该UDP报文（其他接收端口不是68）

在DHCP提供报文中有以下信息：

事务ID:DHCP客户会根据DHCP提供的事务ID,当报文中的事务ID与客户端的发送的事务ID相等时，就表示是自己请求的报文，将其接收。

配置信息：IP地址、子网掩码、地址租期等。

在使用IP地址时会使用ARP协议来确保所选IP地址未被网络中其他主机占用。

在本例子中会受到两个服务器发来的报文，只会从中选择一个，并且一般会选择先到达的那个。并向该服务器发送DHCP请求发送报文。

客户端发送选择服务器的发送请求报文：

选择服务器的发送请求报文

此时为了避免向网络中的每一个DHCP服务器单播发送DHCP请求报文，选择广播发送报文，来告知他们是不是自己选择的DHCP服务器。

DHCP请求报文中封装有以下数据：
事务ID、DHCP客户端的MAC地址、接受租约中的IP地址、接收此租约DHCP服务器的IP地址。

DPCH服务器根据报文中的内容，若发现其选择自己服务器，便将其接收，并给该客户端发送DHCP确认报文。

DHCP服务器发送确认报文：

此报文中数据设置为:
源地址：DHCP服务器1的IP地址

目的地址：广播地址

DHCP客户经过验证收到该报文后就可以使用租用的IP地址。（在使用前还会进行ARP检测）

时间推进情况

当到达租用期的一半时，会发送续约请求给服务器，根据服务器情况进行相应反馈。

若没收到服务器反馈，会在0.75个续约期后再次发送并等待回应。

若还是没有反应，会在续约期到达后立即放弃使用该IP地址。

客户端可以随时终止使用该IP地址。

DHCP中继代理

首先思考一个问题：

有路由器进行隔离的网络能使用DHCP吗？

由于路由器隔离广播域，因此其DHCP请求报文不能发送到DHCP服务器中，所以其不能使用DHCP服务。

解决方法是给服务器配置一个DHCP服务器地址，使其称为DHCP代理中继：

这样做的原因是可以减少DHCP服务器的数量。

通过中继代理进行转发来获取DHCP，而不用新增加一个DHCP服务器。

6.4 域名系统DNS

域名系统DNS的作用是将请求的域名转换为IP地址，给相关程序进行发送IP请求。

使用过程如下：
DNS使用过程

在浏览器中输入域名后，用户主机首先会在自己的DNS高速缓存中查找该域名所对应的IP地址。当在本次高速缓存查找不到后，会向网络中的某台DNS服务器查询。

在DNS服务器中有相关的域名和IP地址数据库，收到查询请求报文后，会在数据库中进行查寻，之后将查询结构发送给主机。

主机收到对应的IP地址后就会进行访问。

此时出现一个问题，因特网能否只使用一台DNS服务器?

答案是不行的。

因特网不能使用一台DNS服务器

层次树状结构的域名结构

因特网采用层次树状结构的域名结构

关于域名的知识点：

顶级域名分为以下三类：

域名分类

值得注意的是，域名一样但是代表的级别不一定一样。

因特网的域名空间举例：

域名空间倒树

域名空间的整体样子是一棵倒着的树，越往下一级越多分支。

域名和IP地址的映射关系必须保存在域名服务器中，供所有其他应用查询。显然不能将所有信息都存储在一台域名服务器中。
DNS使用分布在各地的域名服务器来实现域名到IP地址的转换。

域名服务器的分类：

域名解析的过程：

递归查询

与递归的思路一直，该查询是层层向上发出查询请求，查询到后在层层向下返回查询结果，

迭代查询

迭代查询的思路是：

每次查询先向最高级查询（根域名服务器），最高级根据查询情况返回下一级该向哪一级查询，如此重复进行，知道查询完毕。

由于递归查询对被查询域名服务器负担太大，永通常采用：
从请求主机到本地域名服务器的查询是递归查询，其余查询是迭代查询。

提高域名查询效率的措施，设置高速缓存：

高速缓存

有高速缓存的查询过程为:
高速缓存查询过程

文件传送协议FTP

文件传送是将某台计算机中的文件通过网络传送到可能相距很远的一台计算机中，是一项基本的网络应用
文件传输协议FTP是因特网上使用的最广泛的文件传送协议
FTP协议的要点：

FTP提供交互式的访问，允许客户指明文件的类型和格式（如指明是否使用ASCII码），并允许文件具有存取权限（如访问文件必须经过授权，并输入有效的口令）
FTP屏蔽了各计算机系统的细节，因而适合于在异构网络中任意计算机之间传输文件

在因特网发展早期阶段，用FTP传输占整个因特网通信量的三分之一，而电子邮件和域名系统所产生的通信量还要小于FTP所产生的通信量。到了1995年，万维网的通信量才首次超过了FTP

FTP的应用过程

FTP使用C/S方式（用户/服务器方式）

FTP客户计算机可将各种类型的文件上传到FTP服务器计算机：
上传文件到FTP服务器
FTP客户计算机可以从FTP服务器计算机下载文件：
从FTP服务器下载文件

FTP服务器可以有专用的高速服务器组成，也可以是普通的个人计算机。

在Windows中就可以使用自带的FTP服务创建FTP 服务器，或者使用第三方FTP软件创建客户端。

根据应用需求的不同，FTP服务器可能需要一台高性能和高可靠性的服务器计算机，也可能只需要一台普通的个人计算机即可。

FTP常见用途

FTP的基本工作原理

首先服务器会不断监听FTP协议的数值端口，端口号为21，等待客户端连接。

此后，FTP工作分为以下几步：

FTP客户端随机选择一个临时端口号发起建立TCP连接：

此条连接用于传送控制命令的TCP连接，当有数据需要发送时，会重新发起建立传输数据的TCP连接。

有数据要传输时，客户端通过命令通道发送建立数据连接信号，此时服务器主动发起建立连接请求：

有数据要传输时，客户端通过命令通道发送建立数据连接信号，此时服务器就会主动发起连接建立请求报文，此时双方将会开始建立用于发送数据的通道。

由于其是服务器主动请求建立连接，因此称为主动连接，接下来还有一种被动连接：

有数据要传输时，客户端通过命令通道通知某个临时端口被动等待TCP连接：

被动连接

有数据要传输时，客户端通过命令通道通知某个临时端口被动等待TCP连接。

此后客户端主动会发起与服务器建立TCP连接的请求，建立数据通道。

由于此过程中服务器是被动等待请求建立连接的，因此称为被动连接。

需要注意的是，在两种连接中：

控制连接在整个会话期间一直保持打开，用于传送FTP相关的控制命令。
传输连接用于文件传输，每次文件传输时才建立，传输结束后就关闭。

6.6 电子邮件

电子邮件（E-mail）是因特网上最早流行的一种应用，并且仍是当今因特网上最重要、最实用的应用之一。
传统的电话通信属于试试通信，具有以下两个缺点：
电子邮件和邮件系统的寄信相似，其工作过程如下：
电子邮件使用方便、传播迅速并且费用低廉。不仅可以传送文字信息，而且还可以附上声音和图像。
随着电子邮件的广泛应用，许多国家已经正式取消了电报业务。
电子邮件也是使用了客户/服务器方式
电子邮件系统的三个主要组成构件：用户代理，路由服务器以及电子邮件所需协议。

电子邮件的发送过程：

可见以上发送邮件到服务器用到了SMTP协议，从服务器接收文件用到了POP3协议。

简单邮件传送协议SMTP（Simple Mail Transfer ）基本工作原理

STMP工作原理原理概述：

SMTP概述

SMTP发送方的邮件服务器会周期性对邮件进行缓存扫描，若发现有邮件，会通过TCP协议，端口号25与接收方的邮件服务器建立连接。

建立这条连接后，STMP客户基于这条连接给SMTP服务器发送SMTP命令，共14条。SMTP服务器会给SMTP客户端发送相应的应答，共21种。

双方通过这种命令和应答的方式最终实现客户发送邮件给SMTP服务器。

SMTP工作详细过程：

SMTP工作详细过程

电子邮件格式：

电子邮件中的首部和主体都需要用户自行填写。

SMTP的一些知识点：
SMTP知识点

MIME是一种将SMTP传递种非ASCII码值进行转换的协议，其工作流程如下：

常用的邮件读取协议

邮局协议POP(Post Office Protocol)，POP3使其第三个版本，是因特网正式标准。

POP协议特点：

因特网邮件访问协议IMAP(Internet Message Access Protocol),IMAP4是其第四个版本，没目前还只是因特网建议标准。

IMAP特点：

POP3和IMAP4都采用基于TCP连接的客户端/服务器方式。POP3使用熟知端口110，IMAP4使用熟知端口143.

基于万维网的电子邮件

基于万维网的电子邮件通过浏览器登陆（提供用户名和口令）邮件服务器万维网网站就可以撰写、收发、阅读和管理电子邮件。这种方式和IMAP很类似，不同的是用户计算机无需安装专门的用户代理程序，只需要使用通用的万维网浏览器。
邮件服务器网站通常都提供非常强大和方便的邮件管理功能，用户可以在邮件服务器网站上管理和处理自己的邮件，而不需要将邮件下载到本地进行管理。

例如：

网易服务器

用户通过登陆HTTP请求登陆网易邮件服务器，进行邮件操作，若发送给本服务器的用户，直接通过HTTP超文本协议进行发送。

不同的服务器

若是不同的服务器，服务器之间会通过SMTP协议转发邮件给对应服务器，再发送给对应用户。

6.7 万维网WWW

概述

万维网WWW(World Wide web)并非某种特殊的计算机网络。是一个规模很大、联机式的信息储藏所，是运行在因特网上的一个分布式应用。
万维网利用网页件的超链接将不同网站的网页链接成一张逻辑上的信息网。万维网用链接的方法能非常方便地从互联网上的一个站点访问另一个站点，从而主动地按需获取丰富的信息。
万维网以客户 - 服务器方式工作
浏览器就是在用户计算机上的万维网客户程序。万维网文档所驻留的计算机则运行服务器程序，因此这个计算机也称为万维网服务器。
客户程序向服务器程序发出请求，服务器程序向客户程序送回客户所要的万维网文档。

关于浏览器：
浏览器知识

一次万维网访问过程：

一次万维网访问过程

客户端向目的IP地址发送请求，服务端收到后会通过因特网发送响应报文，也就是上述的万维网文档。

为了方便访问在室接范围的文档，万维网使用统一资源定位符URL，URL来知名因特网上任何种类资源的位置。

例如：

该URL就代表了该资源的位置。

万维网的文档：

例如：
在这里插入图片描述

我们对浏览器的页面进行另存为到本地，其文件就是其万维网的文档。

万维网的文档主要有以下文件：

万维网文档文件

其主要功能为：
文件格式解释

超文本传输协议HTTP(HyperText Transfer Protocol)

HTTP定义了浏览器（万维网进行）怎样向万维网服务器请求万维网文档，以及万维网服务器怎么样把万维网文档传送给浏览器。

例如：

用户主机需要访问万维网服务器。
HTTP举例

首先客户进程会利用80端口和服务器建立TCP请求，然后通过该连接发送HTTP请求报文。

服务器收到请求报文后也会通过该连接发送HTTP响应报文。

HTTP/1.0采用非持续连接方式。该方式下，每次浏览器要请求一个文件都要与服务器建立TCP连接，当收到响应后就立即关闭连接。

例如：

非持续连接示例

在这种方式下，在建立阶段的第三次握手会写道HTTP请求报文进行发送，每次请求一次数据都需要花费2RTT + 文档的传输时延。

因此存在以下弊端：

1.0弊端
因此出现了HTTP/1.1版本：

HTTP/1.1采用持续连接方式。该方式下，万维网服务器在发送响应后仍然保持这条连接，使同一个客户和该服务器可以在这条连接上继续传送后续的HTTP报文。这样子并不局限于传送同一个页面上引用的对象，而是只要这些文档都在同一个服务器上就行。

HTTP报文格式:

HTTP是面向文本的。其报文的每一个字段都是一些ASCII码串，并且每个字段的长度都是不确定的。
HTTP报文分为请求报文、响应报文。

请求报文：
HTTP请求报文格式

HTTP报文格式中由首部行、实体构成。

首部行中的每一个字段都由空格隔开，换行时使用换行符分隔。

首部与主体之间通过一个空行（换行符）分隔。

例如：

HTTP请求报文示例
HTTP的首部方法字段取值可能：

响应报文：

响应报文格式
响应报文常见的状态码取值：

状态码取值
例如:

错误例子
也就是访问网页时显示出来的：
错误显示

万维网中的Cookie：

Cookie是用来在服务器上记录用户信息

例如：
Cookie示例

在首次访问该网页时，服务器会返回一个Cookie标签。

用户端会将其保存在本地文件，将Cookie与IP地址对应。

此后在重新访问该网站时会在Cookie文件中检查有无该IP地址的Cookie，若有则使用该Cookie，可以有效提高效率。

万维网中的缓存和代理服务器

缓存和代理服务器
例如：
代理服务器有该对象

当校园网中的某台主机要访问因特网上的原始服务器时，会先请求代理服务器，若代理服务器存放有所请求的对象，则代理服务器会向该主机发回所包含的请求对象的响应。

代理服务器没有该对象

当校园网中的某台主机要访问因特网上的原始服务器时，请求代理服务器，若代理服务器没有所请求的对象，则代理服务器会向原始服务器发送请求。

服务器响应后，代理服务器会将其放入自己的Web缓存，再将其发给用户主机。

若Web缓存命中率比较高，可以大大减少链路上的通信量，因而大大减少了访问因特网的时延。

有这样一种情况：

代理服务器情况一

若代理服务器存下该请求的缓存后，原始服务器该请求响应有所修改，此时若用户再次请求，在代理服务器的缓存中就是旧的响应报文了。

所以原始服务器通常会为每个响应的对象设定一个修改时间字段和一个有效日期字段。

因此实际请求过程如下：

修改时间字段未过期

若修改时间字段未过期，则会之间将缓存中报文封装在响应报文中发回给主机。

若修改时间过期但是没有修改

若修改时间已过期，此时会向原始服务器发送一个if notifiy信号，意思是询问是否发生响应文档改变。

若没有改变，则原始服务器回送一个 NOT NOTIFY信号，代理服务器接收到后会将修改时间改为当前时间，不修改缓存中的文档，并且将缓存中的文档包装在响应报文中发送给用户主机。

修改时间过期并且有修改

若修改时间已过期，此时会向原始服务器发送一个if notifiy信号，意思是询问是否发生响应文档改变。

若改变，则原始服务器会在响应报文中附带修改后的文档，代理服务器接收到后会将修改时间改为当前时间，并且缓存中的文档进行更新，更新后，将缓存中新的文档包装在响应报文中发送给用户主机。

万维网小结：