基于TCP的服务器端/客户端(2)

前一篇从编程角度说明了基于TCP的服务器端/客户端,这一篇主要详细描述TCP的必要理论知识和如何解决上一篇遗留的问题。

回声客户端可以提前知道接收的数据长度,但我们应该意识到,更多情况下这不太可能。既然如此,若无法预知接收数据长度时应如何收发数据?此时需要的就是应用层协议的定义。之前的回声服务器端/客户端中定义了如下协议。
“收到Q就立即终止连接。”
同样,收发数据过程中也需要定好规则(协议)以表示数据的边界,或提前告知收发数据的大小。服务器端/客户端实现过程中逐步定义的这些规则集合就是应用层协议。可以看出,应用层协议并不是高深莫测的存在,只不过是为特定程序的实现而制定的规则。
比如我们实现一个四则运算的程序,就需要有一下的协议:
1️⃣ 客户端连接到服务器端后以1字节整数形式传递待算数字个数。

2️⃣ 客户端向服务器端传递的每个整数型数据占4字节。

3️⃣ 传递整数型数据后接着传递运算符。运算符信息占用1字节。

4️⃣ 选择字符+、-、*之一传递。

5️⃣ 服务器端以4字节整型向客户端传回运算结果。

6️⃣ 客户端得到运算结果后终止与服务器端的连接。

2、TCP原理
TCP套接字的数据收发无边界。服务器端即使调用1次write函数传输40字节的数据,客户端也有可能通过4次read函数调用每次读取10字节。但此处也有一些疑问,服务器端一次性传输了40字节,而客户端居然可以缓慢地分批接收。客户端接收10字节后,剩下的30字节在何处等候呢?是不是像飞机为等待着陆而在空中盘旋一样,剩下30字节也在网络中徘徊并等待接收呢?

实际上,write函数调用后并非立即传输数据,read函数调用后也并非马上接收数据。更准确地说, write函数调用瞬间,数据将移至输出缓冲;read函数调用瞬间,从输入缓冲读取数据。

调用write函数是,数据将移到输出缓冲,在适当的时候(不管是分别传送还是一次性传送)传向对方的输入缓冲。这时对方将调用read函数从输入缓冲读取数据,这些I/O缓冲特性可调整如下。

1️⃣ I/O缓冲在每个TCP套接字中单独存在。

2️⃣ I/O缓冲在创建套接字时自动生成。

3️⃣ 即使关闭套接字也会继续传递输出缓冲中遗留的数据。

4️⃣ 关闭套接字将丢失输入缓冲中的数据。

那么,下面这种情况会引发什么事情?
“客户端输入缓冲为50字节,而服务器端传输了100字节。”
这的确是个问题,输入缓冲只有50字节,却收到了100字节的数据。可以提出如下解决方案:
“填满输入缓冲前迅速调用read函数读取数据,这样会腾出一部分空间,问题就解决了。”
当然,这只是一个小玩笑,马上给出结论:
“不会发生超过输入缓冲大小的数据传输。”
也就是说,根本不会发生这类问题,因为TCP会控制数据流。TCP中有滑动窗口(Sliding Window)协议,用对话方式呈现如下
1️⃣ 套接字A:“你好,最多可以向我传递50字节。”

2️⃣ 套接字B:“OK!”

1️⃣ 套接字A:“我腾出了20字节的空间,最多可以收70字节。”

2️⃣ 套接字B:“OK!”

数据收发也是如此,因此TCP不会 因为缓冲溢出而丢失数据。

TCP如何实现可靠传输呢,使数据不乱序,丢失,重复发送等,下面的内容会给你答案!
TCP套节从创建消失所经过过程分为如下3步。

1️⃣ 与对方套接字建立连接。

2️⃣ 与对方套接字进行数据交换。

3️⃣ 断开与对方套接字的连接。

2.1 TCP内部工作原理1: 与对方套接字建立连接
首先讲解与对象套接字建立连接的过程。连接过程中套接字之间的对话如下。

1️⃣ 套接字A:“你好,套接字B。我这儿有数据要传给你,建立连接吧。”

2️⃣ 套接字B:“好的,我这边已就绪。”

3️⃣ 套接字A:“谢谢你受理我的请求。”

TCP在实际通行过程中也会经过3此对话过程,因此,该过称又称三次握手。
在这里插入图片描述

相信学过计算机网络的都知道这个知识点,我们更加详细讲一下这个知识点:
套接字是以全双工(Full-duplex)方式工作的。也就是说,它可以双向传递数据。因此,收发数据前需要做一些准备。首先,请求连接的主机A向主机B传递如下信息:

[SYN] SEQ: 1000, ACK; -

该消息中SEQ为1000,ACK为空,而SEQ为1000的含义如下:
现传递的数据包序号为1000,如果接收无误,请通知我向您传递1001号数据包。“
这是首次请求连接时使用的消息,又称SYN。SYN是Synchronization的简写,表示收发数据前传输的同步消息。接下来主机B向A传递如下消息:

[SYN+ACK] SEQ: 2000, ACK: 1001
此时SEQ为2000,ACK为1001,而SEQ2000的含义如下:
”现传递的数据包序号为2000,如果接收无误,请通知我向您传递2001号数据包。“
而ACK 1001的含义如下:
”刚才传输的SEQ为1000的数据包接收无误,现在请传递SEQ为1001的数据包。“
对主机A首次传输的数据包的确认消息(ACK 1001)和为主机B传输数据做准备的同步消息(SEQ 2000)捆绑发送,因此,此种类型的消息又称SYN+ACK。
收发数据前向数据分配序号,并向对方通报此序号,这都是为防止数据丢失所做的准备。 因此,TCP可以保证可靠的数据传输。最后观察主机A向主机B传输的消息:

[ACK] SEQ: 1001, ACK: 2001
之前也讨论过,TCP连接过称中发送数据包时需分配序号。在之前的序号1000的基础上加1,也就是分配1001.此时该数据包传递如下消息:
”已正确收到传输的SEQ为2000的数据包,现在可以传输SEQ为2001的数据包。“
这样就传输了添加ACK 2001的ACK消息。至此,主机A和主机B确认了彼此均就绪。

仔细一看,发现非常神奇,双方通过三次互动确认信息。通过向数据包分配序号并确认,可以在数据丢失时马上查看并重传丢失的数据包。

2.2TCP内部工作原理2:与对方主机的数据交换
通过第一步三次握手过程完成了数据交换准备,下面就正式开始收发数据。
在这里插入图片描述

上图给出了主机A分2次(分2个数据包)向主机B传递200字节的过程。首先,主机A通过1个数据包发送100个字节的数据,数据包的SEQ为1200.主机B为了确认这一点,向主机A发送ACK1301消息。

此时的ACK号为1301而非1201,原因在于ACK号的增量为传输的数据字节数。假设每次ACK号不加传输的字节数,这样虽然可以确认数据包的传输,但无法明确100字节全部正确传递还是丢失了一部分,比如只传递了80字节。因此按如下公式传递ACK消息:

ACK号——>SEQ号 + 传递的字节数 + 1

与三次握手协议相同,最后加1为了告诉对方下次要传递的SEQ号。下面分析传递过程中数据包消失的情况:
在这里插入图片描述
通过SEQ 1301数据包向主机B传递100字节数据。但中间发生了错误,主机B未收到。经过一段时间后,主机A仍未收到对于SEQ 1301的ACK确认,因此试着重传该数据包。为了完成数据包重传,TCP套接字启动计时器以等待ACK应答。若相应计时器发生超时(Time-out)则重传。

2.3TCP的内部工作原理3:断开与套接字的连接

TCP套接字的结束过程也非常优雅。如果对方还有数据需要传输时直接断掉连接会出问题,所以断开连接时需要双方协商。断开连接时双方对话如下。

1️⃣ 套接字A:“我希望断开连接。”

2️⃣ 套接字B:“哦,是吗?请稍等。”

3️⃣ 套接字B:“我也准备就绪,可以断开连接。”

4️⃣ 套接字A:“好的,谢谢合作。”

先由套接字A向套接字B传递断开连接的消息,套接字B发出确认收到的消息,然后向套接字A传递可以断开连接的消息,套接字A同样发出确认消息。

在这里插入图片描述
数据包内的FIN表示断开连接。也就是说,双方各发送1此FIN消息后断开连接。此过程经历4个阶段,因此又称四次握手。SEQ和ACK的含义与之前讲解的内容一致。向主机A传递了两次ACK 5001,也许这会让各位感到困惑。其实,第二次FIN数据包中的ACK 5001知识因为接收ACK消息后未接收数据而重传的。
我发现这个确认重传机制很有意思,只要发送方没收到确认ACK,就会再次发送,保证了可靠传输的进行。

猜你喜欢

转载自blog.csdn.net/weixin_53344209/article/details/114107071