5、TCP/IP学习笔记--TCP与UDP

一、传输层的作用

1、传输层是OSI中最重要、最关键的一层,是唯一负责总体的数据传输的数据控制的一层。传输层对会话层等高三层提供可靠的传输服务,对网络层提供可靠的目的地站点信息

2、TCP/IP中有两个具有代表性的传输层协议,它们分别是TCP和UDP。TCP提供可靠的通信传输。而UDP则通常被用于让广播和细节控制交给应用的通信传输。


二、套接字(Socket)

1、应用在使用TCP或UDP时,会用到操作系统提供的类库。这种类库也称为API。 使用TCP或UDP通信时,又会广泛使用到套接字(socket)的API。套接字原本是由BSD UNIX开发的,但是后被移植到了Windows的winsock以及Linux等操作系统中。应用程序利用套接字,可以设置对端的IP地址、端口号,并实现数据的发送与接收。



三、端口号

1、端口号定义

数据链路和IP中的地址,分别指的是MAC地址和IP地址。前者用来识别同一链路中不同的计算机,后者用来识别TCP/IP网络中互联的主机和路由器。在传输层中也有这种类似于地址的概念,那就是端口号。端口号用来识别同一台计算机中进行通信的不同应用程序。因此,它也被称为程序地址。

2、根据端口号识别应用

一台计算机上同时可以运行多个程序。例如接收WWW服务的Web浏览器、电邮客户端、远程登陆用的ssh客户端等程序都可同时进行。传输层协议正是利用这些端口号识别本机中正在进行通信的应用程序,并准确地将数据传输


3、通过IP地址、端口号、协议号进行通信识别

TCP/IP或UDP/IP通信中通常采用5个信息来源来识别一个通信。它们是“源IP地址”、“目标地址”、“协议号”、“源端口号”、“目标端口号”。只要其中某一项不同,则被认为是其他通信。


4、端口号如何确定

在实际进行通信时,要事先确定端口号。确定端口号的方法分为两种:

(1)标准既定的端口号

这种方法也叫静态方法它是指每个应用程序都有其指定的端口号。但并不是说可以随意使用任何一个端口号。每一个端口号都有其对应的使用目的。例如,HTTP、TELNET、FTP等广为使用的应用协议中所使用的端口号就是固定的。这些端口号也被称之为知名端口号(Well-Konwn Port Number)。知名端口号一般由0到1023的数字分配而成。应用程序应该避免使用知名端口号进行既定目的之外的通信,以免产生冲突。除了知名端口号之外,还有一些端口号也被正式注册。它们分布在1024和49151的数字之间。不过,这些端口号可应用于任何通信用途。关于知名端口号和已经注册端口号的最新消息,点击连接Service Name and Transport Protocol Port Number Registry

    A、TCP具有代表性的知名端口号



    B、UDP具有代表性的知名端口号



(2)时序分配法
时序分配法也叫动态分配法。通信时,服务端有必要确定监听端口号,但是接受服务的客户端没有必要确定端口号。所以客户端可以不用自己设置端口号,而全权交给操作系统进行分配。操作系统可以为每一个应用程序分配互不冲突的端口号。例如,每需要一个新的端口号时,就在之前分配号码的基础上加1(这类似于挂载USB camera,对应video0、video1、video2)。这样,操作系统就可以动态地管理端口号了。动态分配的端口号取值范围在49152到65535之间


四、UDP

1、UDP的特点及其目的

UDP是 User Datagram Protocol的缩写。UDP不提供复杂的控制机制,利用IP提供面向无连接的通信服务。并且它是将应用程序发来的数据在收到的那一刹那,立刻按照原样发送到网络上的一种机制。即使是出现网络拥堵的情况下,UDP也无法进行流量控制等避免网络拥塞的行为。此外传输过程中即使出现丢包,UDP也不负责重发。甚至当出现包的到达顺序乱掉时也没有纠正的功能。如果需要这些细节控制,将不得不交由采用UDP协议的应用程序处理。UDP有点类似于用户说什么听什么的机制,但是需要用户充分考虑好上层协议类型并制作相应的应用程序。因此可以说UDP按照”制作程序的那些用户的指示行事“。由于UDP面向无连接,它可以随时发送数据。再加上UDP本身的处理既简单又高效,因此经常用于以下几个方面:
A、包总量较少的通信(DNS、SNMP等)
B、视频、音频等多媒体通信(即时通信)
C、限定于LAN等特定网络中的应用通信

D、广播通信(广播、多播)

2、用户与程序员

此处所使用的”用户“并不简单单指”互联网的使用者“。曾经它也表示为那些编程的程序员。因此,UDP的”用户“(User)在现在看来其实就相当于程序员。也就是说。认为UDP是按照程序员的编程思路在传输数据报也情有可原

与之相比,由于TCP拥有各式各样的控制机制,所以它在发送数据时未必按照程序员的编程思路进行

3、UDP首部的格式

下图展示了UDP首部的格式。除去数据的部分正是UDP的首部。UDP的首部由源端口号、目标端口号、包长和校验和组成。



五、TCP.

1、TCP的介绍及连接的含义

(1)介绍

UDP是一种没有复杂控制,提供面向无连接通信服务的一种协议。换句话说,它将部分控制转移给应用程序区处理,自己却只提供作为传输协议的最基本功能。与UDP不同,TCP则”人如其名“,可以说是对”传输、发送、通信“进行”控制“的”协议“。TCP与UDP的区别相当大。它充分实现了数据传输时各种控制功能,可以进行丢包时的重发控制,还可以对次序乱掉的分包进行顺序控制。这是UDP没有的。此外,TCP作为一种面向有链接的协议,只有在确认通信对端存在时才会发送数据,从而可以控制通信流量的浪费。根据TCP这些机制,在IP这种无连接的网络上也能实现高可靠性的通信。

(2)连接

连接是指各种设备、线路,或网路中进行通信的两个应用程序为了相互传递消息而专有的、虚拟的通信线路,也叫虚拟电路。一旦建立了连接,进行通信的应用程序只使用这个虚拟的通信线路发送和接收数据,就可以保障信息的传输。应用程序可以不用顾虑提供尽职服务的IP网络上可能发生的各种问题,依然可以转发数据。TCP则负责控制连接的建立、断开、保持等管理工作。


2、TCP的特点及其目的

为了通过IP数据报实现可靠性传输,需要考虑很多事情,例如数据的破坏、丢包、重复以及分片顺序混乱等问题。TCP通过检验和、序列号、确认应答、重发控制、连接管理以及窗口控制等机制实现可靠性传输。

3、通过序列号与确认应答提高可靠性

(1)在TCP中,当发送端的数据到达接收主机时,接收端主机会返回一个已收到消息的通知。这个消息叫做确认应答(ACK)。通常,两个人对话时,在谈话的停顿处可以点头或询问以确认谈话内容。如果对方迟迟没有任何反馈,说话的一方还可以再重复一遍以保证对方确实听到。因此,对方是否理解了此次对话内容,对方是否完全听到了对话的内容,都靠对方的反应来判断。网络中的”确认应答“就是类似于返回了一个确认应答(ACK)。而当对方没有理解对话内容或没有听清时会问一句”咦?“这好比一个否定确认应答(NACK)。

正常的数据报传输如下:


(2)TCP通过肯定的确认应答(ACK)实现可靠的数据传输。当发送端将数据发处后会等待对端的确认应答。
如果有确认应答,说明数据已经成功到达对端。反之,数据丢失的可能性很大。如下图所示,在一定时间内没有等到确认应答,

发送端就可以认为数据已经丢失,并进行重发。由此,即使产生了丢包,任然能够保证数据能够到达对端,实现可靠传输。


(3)未收到确认应答并不意味着数据一定丢失。也有可能是数据对方已经收到,只是返回的确认应答在途中丢失。

这种情况也会导致发送端因没有收到确认应答,而认为数据没有到达目的地,从而进行重新发送。如下图:


(4)此外,也有可能因为一些其他原因导致确认应答延迟到达,在源主机重发数据以后才到达的情况也屡见不鲜。此时,源发送主机只要按照机制重发数据即可。但是对于目标主机来说,这简直就是一种”灾难“。它会反复收到相同的数据。而为了上层应用提供可靠的传输,必须得放弃重复的数据包。为此,就必须引入一种机制,它能够识别是否已经接收数据,又能够判断是否需要接收。上述这些确认应答处理、重发控制以及重复控制等功能都可以通过序列号实现序列号是按顺序给发送数据的每一个字节(8位字节)都标上号码的编号。接收端查询接收数据TCP首部中的序列号和数据的长度,将自己下一步应该接收的序列号作为确认应答返送回去。就这样,通过序列号和确认应答号,TCP可以实现可靠传输。


4、重发超时如何确定

重发超时是指在重发数据之前,等待确认应答到来的那个特定时间间隔。如果超过了这个时间任未收到确认应答,发送端将进行数据重发。这个重发超时的具体时间长度又是如何确定的呢?最理想的是,找到一个最小的时间。然而这个时间长短随着数据包途径的网络环境的不同而有所变化。TCP要求不论处在何种网络环境下都要提供高性能通信,并且无论网络拥堵情况发生何种变化,都必须保持这一特性。为此,他会在每次发包时都会计算往返时间及其偏差。将这个往返时间和偏差相加重发超时的时间,就是比这个总和要稍微大一点的值。重发超时的计算要考虑偏差是有原因的,如图:


在BSD的Linux以及Windows系统中,超时都以0.5秒为单位进行控制,因此重发超时都是0.5秒的整数倍。不过,由于最初的数据包还不知道往返时间,所以其重发超时一般设置为6秒左右。数据被重发之后若还是收不到应答,则进行再次发送。此时,等待确认应答的时间将会以2倍、4倍的指数函数延长。此外,数据也不会被无限、反复地发送。达到一定重发次数之后,如果仍未有任何确认应答返回,就会判断为网络或对端主机发生了异常,强制关闭连接。并且通知应用通信异常强行终止。

5、连接管理

TCP提供面向有连接的通信传输。面向有连接是指在数据通信开始之前先做好通信两端之间的准备工作。UDP是一种面向无连接的通信协议,因此不检查对端是否可以通信,直接将UDP包发送出去。TCP与此相反,它会在数据通信之前,通过TCP首部发送一个SYN包作为建立连接的请求等待确认应答。如果对端发来确认应答,则认为可以进行数据通信。如果对端的确认应答未能到达,就不会进行数据通信。此外,在通信结束时会进行断开连接的处理(FIN包)。可以使用TCP首部用于控制的字段来管理TCP连接。一个连接的建立与断开,正常过程至少需要来回发送7个包才能完成。


6、TCP数据传输单位与控制机制

TCP数据传输以段为单位,为了提高传输速度,推出了窗口控制、窗口下的重发控制、流控制、拥塞控制。

(1)TCP以段为单位发送数据

数据包的单位即”最大消息长度“(MSS:Max Segment Size)是数据传输时数据分割的单位。MSS是在三次握手的时候,在两端主机之间被计算得出。两端主机在发出建立连接的请求时,会在TCP首部中写入MSS选项,告诉对方自己的接口能够适应的MSS的大小。然后会在两者之间选择一个较小的值投入使用。


(2)窗口控制

TCP以1个段为单位,每发一个段进行一次确定应答的处理,如图,这样传输方式有一个缺点:包的往返时间越长通信性能越低


为解决这个问题,TCP引入了窗口这个概念。如图,确认应答在更大的单位下进行。也就是发送端主机,在发送了一个段以后不必要一直等待确认应答,而是继续发送。窗口大小就是指无需等待确认应答而可以继续发送数据的最大值。如下图,窗口大小为

4个段。这个机制实现了使用大量的缓冲区,通过对多个段同时进行确认应答的功能


如下图所示,发送数据中高亮圈起的部分正是前面所提到的窗口。在这个窗口内的数据即便没有收到确认应答也可以发送出去。此外,从该窗口中能看到的数据因其某种数据已在传输中丢失,所以发送端不能接收确认应答,这种情况需要进行重发。为此,发送端主机在等到确认应答返回前,必须在缓冲区中保留这部分数据。在滑动窗口以外的部分包括尚未发送的数据以及已经确认对端已收到的数据。当数据发出后若如期收到确认应答就可以不用再进行重发,此时数据就可以从缓冲区清楚。收到确认应答的情况下,将窗口滑动到确认应答中的序列号的位置。这样可以顺序地将多个段同时发送提高通信性能。这种机制也称为滑动窗口控制


(3)窗口下的重发控制

在没有窗口控制的时候,没有收到确认应答的数据都会被重发。而使用了窗口控制,如图,某些确认应答即使丢失也无需重发。


如图所示。某一报文段丢失后,发送端会一直收到序列号为1001的确认应答,这个确认应答好像在提醒发送端”我想接收的是从1001开始的数据“。因此,窗口比较大,又出现报文段丢失的情况下,同一个序列号的确认应答将会被重复不断的返回。而发送端主机如果连续3次收到同一个确认应答,就会将其所对应的数据进行重发。这种机制比之前提到的超时管理更加高效,因此被称为高速重发控制


(4)流控制

TCP提供一种机制可以让发送端根据接收端的实际接收能力控制发送的数据量。这就是所谓的流控制。它的具体操作是,接收端主机向发送端主机通知自己可以接收数据的大小,于是发送端会发送不超过这个限度的数据。该大小限度就被称作窗口大小。TCP首部中,专门有一个字段用来通知窗口大小。发送端主机会根据接收端主机的指示,对发送数据的量进行控制。这也是形成了一个完整的TCP流控制(流量控制)。


(5)拥塞控制

如果一个计算机网络中出现拥堵状况,而此时一个新的TCP通信连接创建,并开始发送大量数据,这样极有可能导致整个网络的瘫痪。为了防止出现这样的状况,在通信一开始就会通过一个叫做慢启动的算法得出的数值,对发送的数据进行控制。



7、TCP首部格式


六、其他传输层协议

1、传输层的协议主要是TCP、UDP协议,其它被提案的协议有UDP-Lite、SCTP、DCCP。


致谢

1、《图解TCP IP》[第5版] 作者 (日)竹下隆史,等  译者 (日)乌尼日其其格

2、TCP--百度百科

3、UDP--百度百科

4、传输层

5、Service Name and Transport Protocol Port Number Registry





猜你喜欢

转载自blog.csdn.net/qq_38880380/article/details/80276320