一.tcp三次握手
我总是觉得计算机网络是人来设计的,既然计算机网络用于世界互联,那么计算机网络之间的交流肯定是相当拟人化的。
假设小明给新客户小刚打电话,接通了之后小明肯定要介绍下自己
“你好,我是小明。”(1)
电话那一头的人礼貌性回道:“你好,我是小刚。”这就表示小刚向小明确认他能听到小明说话,而他不确定小明能否听到他说话,小刚还需要小明的确认。(2)
然后小明就确认小刚可以听他说话了,并要告诉小刚他能听到他说话:“小刚我能听到你说话,……”。(3)
这就和tcp的三次握手一模一样的,为什么是三次呢?通信双发需要就某个问题达成一致. 而要解决这个问题, 无论你在消息中包含什么信息, 三次通信是理论上的最小值。
那么我们试试从打电话的过程中总计出tcp的性质:
1.首先电话拨打过程必须双方接通才算有效传输信息,tcp体现的就是传输数据是可靠的。
2.小明打电话给小刚接通之后他不会再给其它人打电话,同样此时小刚也不会在接别人的电话,tcp体现的就是连接是点对点的,一条tcp只能连接两个端点。
3.小明和小刚接通电话后,双方都可以随时讲话,tcp体现的就是提供全双工通信,允许通信双方任何时候都能发送数据,tcp 连接的两端都设有发送缓存和接收缓存。
4.根据以上的性质我们又可以归纳tcp 具有提供可靠传输,无差错、不丢失、不重复、按顺序。
5.打电话是用汉语交流的,而tcp是面向字节流的,tcp并不知道所传输的数据的含义,仅把数据看作一连串的字节序列,它也不保证接收方收到的数据块和发送方发出的数据块具有大小对应关系。
二.tcp报文段结构
我们大概了解了tcp的连接过程和特点,再详细的看下tcp报文。
tcp报文由两部分组成,一部分是应用层交付给tcp的数据,一部分是自身的报头,TCP 报文段的报头有前 20 字节的固定部分,后面 4n 字节是根据需要而添加的字段。如图则是 TCP 报文段结构:
1.源端口和目的端口就不说了;
2.序号:TCP 是面向字节流的,通过 TCP 传送的字节流中的每个字节都按顺序编号,而报头中的序号字段值则指的是本报文段数据的第一个字节的序号。
3.确认序号:占 4 字节,期望收到对方下个报文段的第一个数据字节的序号。
4.数据偏移:占 4 位,指 TCP 报文段的报头长度,包括固定的 20 字节和选项字段。
5.保留:占 6 位,保留为今后使用,目前为 0。
6.控制位:共有 6 个控制位,说明本报文的性质,意义如下:
URG 紧急:当 URG=1 时,它告诉系统此报文中有紧急数据,应优先传送(比如紧急关闭),这要与紧急指针字段配合使用。
ACK 确认:仅当 ACK=1 时确认号字段才有效。建立 TCP 连接后,所有报文段都必须把 ACK 字段置为 1。
PSH 推送:若 TCP 连接的一端希望另一端立即响应,PSH 字段便可以“催促”对方,不再等到缓存区填满才发送。
RST复位:若 TCP 连接出现严重差错,RST 置为 1,断开 TCP 连接,再重新建立连接。
SYN 同步:用于建立和释放连接,稍后会详细介绍。
FIN 终止:用于释放连接,当 FIN=1,表明发送方已经发送完毕,要求释放 TCP 连接。
7.窗口:占 2 个字节。窗口值是指发送者自己的接收窗口大小,因为接收缓存的空间有限。
8.检验和:2 个字节。和 UDP 报文一样,有一个检验和,用于检查报文是否在传输过程中出差错。
9.紧急指针:2 字节。当 URG=1 时才有效,指出本报文段紧急数据的字节数。
10.选项:长度可变,最长可达 40 字节。
三.tcp连接的建立与释放
连接就是我们在上面打电话讲的三次握手:
第一次握手 客户端向服务端发送连接请求报文段。该报文段的头部中SYN=1,ACK=0,seq=x。请求发送后,客户端便进入SYN-SENT状态。PS1:SYN=1,ACK=0表示该报文段为连接请求报文。PS2:x为本次TCP通信的字节流的初始序号。 TCP规定:SYN=1的报文段不能有数据部分,但要消耗掉一个序号。
第二次握手 服务端收到连接请求报文段后,如果同意连接,则会发送一个应答:SYN=1,ACK=1,seq=y,ack=x+1。 该应答发送完成后便进入SYN-RCVD状态。PS1:SYN=1,ACK=1表示该报文段为连接同意的应答报文。PS2:seq=y表示服务端作为发送者时,发送字节流的初始序号。PS3:ack=x+1表示服务端希望下一个数据报发送序号从x+1开始的字节。第三次握手 当客户端收到连接同意的应答后,还要向服务端发送一个确认报文段,表示:服务端发来的连接同意应答已经成功收到。 该报文段的头部为:ACK=1,seq=x+1,ack=y+1。 客户端发完这个报文段后便进入ESTABLISHED状态,服务端收到这个应答后也进入ESTABLISHED状态,此时连接的建立完成!
至此 TCP 连接已经建立,客户端进入 ESTABLISHED(已建立连接)状态,当服务端收到确认后,也进入 ESTABLISHED 状态,它们之间便可以正式传输数据了。
当传输数据结束后,通信双方都可以释放连接,这个释放连接过程被称为 释放连接 :
第一次挥手 若A认为数据发送完成,则它需要向B发送连接释放请求。该请求只有报文头,头中携带的主要参数为: FIN=1,seq=u。此时,A将进入FIN-WAIT-1状态。
第二次挥手 B收到连接释放请求后,会通知相应的应用程序,告诉它A向B这个方向的连接已经释放。此时B进入CLOSE-WAIT状态,并向A发送连接释放的应答,其报文头包含: ACK=1,seq=v,ack=u+1。PS1:ACK=1:除TCP连接请求报文段以外,TCP通信过程中所有数据报的ACK都为1,表示应答。PS2:seq=v,v-1是B向A发送的最后一个字节的序号。PS3:ack=u+1表示希望收到从第u+1个字节开始的报文段,并且已经成功接收了前u个字节。A收到该应答,进入FIN-WAIT-2状态,等待B发送连接释放请求。
第二次挥手完成后,A到B方向的连接已经释放,B不会再接收数据,A也不会再发送数据。但B到A方向的连接仍然存在,B可以继续向A发送数据。
第三次挥手 当B向A发完所有数据后,向A发送连接释放请求,请求头:FIN=1,ACK=1,seq=w,ack=u+1。B便进入LAST-ACK状态。
第四次挥手 A收到释放请求后,向B发送确认应答,此时A进入TIME-WAIT状态。该状态会持续2MSL时间,若该时间段内没有B的重发请求的话,就进入CLOSED状态,撤销TCB。当B收到确认应答后,也便进入CLOSED状态,撤销TCB。
那么为什么非要四次挥手呢?
我们知道,TCP连接是双向的,因此在四次挥手中,前两次挥手用于断开一个方向的连接,后两次挥手用于断开另一方向的连接。
四.tcp基于超时重传的可靠性保证
(1) TCP 报文段的长度可变,根据收发双方的缓存状态、网络状态而调整。
(2) 当 TCP 收到发自 TCP 连接另一端的数据,它将发送一个确认。
(3) 当 TCP 发出一个段后,它启动一个定时器,等待目的端确认收到这个报文段,如果不能及时收到一个确认,将重发这个报文段。这就是稍后介绍的超时重传。
(4) TCP 将保持它首部和数据的检验和。如果通过检验和发现报文段有差错,这个报文段将被丢弃,等待超时重传。
(5) TCP 将数据按字节排序,报文段中有序号,以确保顺序的正确性。
(6) TCP 还能提供流量控制。TCP 连接的每一方都有收发缓存。TCP 的接收端只允许另一端发送接收端缓冲区所能接纳的数据。这将防止较快主机致使较慢主机的缓冲区溢出。
可见超时重发机制是 TCP 可靠性的关键,只要没有得到确认报文段,就重新发送数据报,直到收到对方的确认为止。
五.连续 ARQ 协议
也许你也发现了,按上面的介绍,超时重传机制很费时间,每发送一个数据报都要等待确认。
在实际应用中的确不是这样的,真实情况是,采用了流水线传输:发送方可以连续发送多个报文段(连续发送的数据长度叫做窗口),而不必每发完一段就停下来等待确认。
实际应用中,接收方也不必对收到的每个报文都做回复,而是采用累积确认方式:接收者收到多个连续的报文段后,只回复确认最后一个报文段,表示在这之前的数据都已收到。
六 .用tcpdump 抓取 TCP 报文段
测试所用操作系统为ubutun
先分别写一个tcp的server端和服务端:
server.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <sys/types.h>
#include <unistd.h>
#define BUFLEN 10
int main(int argc, char *argv[])
{
int sockfd, newfd;
struct sockaddr_in s_addr, c_addr;
char buf[BUFLEN];
socklen_t len;
unsigned int port, listnum;
if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){
perror("socket");
exit(errno);
}
if(argv[2])
port = atoi(argv[2]);
else
port = 7777;
if(argv[3])
listnum = atoi(argv[3]);
else
listnum = 3;
bzero(&s_addr, sizeof(s_addr));
s_addr.sin_family = AF_INET;
s_addr.sin_port = htons(port);
if(argv[1])
s_addr.sin_addr.s_addr = inet_addr(argv[1]);
else
s_addr.sin_addr.s_addr = INADDR_ANY;
if((bind(sockfd, (struct sockaddr*) &s_addr,sizeof(struct sockaddr))) == -1){
perror("bind");
exit(errno);
}
if(listen(sockfd,listnum) == -1){
perror("listen");
exit(errno);
}
while(1){
printf("*****************server start***************\n");
len = sizeof(struct sockaddr);
if((newfd = accept(sockfd,(struct sockaddr*) &c_addr, &len)) == -1){
perror("accept");
exit(errno);
}
while(1){
_retry:
bzero(buf,BUFLEN);
printf("enter your words:");
fgets(buf,BUFLEN,stdin);
//fputs(buf,stdout);
if(!strncasecmp(buf,"quit",4)){
printf("server stop\n");
break;
}
if(!strncmp(buf,"\n",1)){
goto _retry;
}
if(strchr(buf,'\n'))
len = send(newfd,buf,strlen(buf)-1,0);
else
len = send(newfd,buf,strlen(buf),0);
if(len > 0)
printf("send successful\n");
else{
printf("send failed\n");
break;
}
bzero(buf,BUFLEN);
len = recv(newfd,buf,BUFLEN,0);
if(len > 0)
printf("receive massage:%s\n",buf);
else{
if(len < 0 )
printf("receive failed\n");
else
printf("client stop\n");
break;
}
}
close(newfd);
/*\u662f\u5426\u9000\u51fa\u670d\u52a1\u5668*/
printf("exit?\uff1ay->yes\uff1bn->no ");
bzero(buf, BUFLEN);
fgets(buf,BUFLEN, stdin);
if(!strncasecmp(buf,"y",1)){
printf("server stop\n");
break;
}
}
close(sockfd);
return 0;
}
client.c
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <errno.h>
#include <sys/socket.h>
#include <arpa/inet.h>
#include <netinet/in.h>
#include <sys/types.h>
#include <unistd.h>
#define BUFLEN 10
int main(int argc, char *argv[])
{
int sockfd;
struct sockaddr_in s_addr;
socklen_t len;
unsigned int port;
char buf[BUFLEN];
if((sockfd = socket(AF_INET, SOCK_STREAM, 0)) == -1){
perror("socket");
exit(errno);
}
if(argv[2])
port = atoi(argv[2]);
else
port = 7777;
bzero(&s_addr, sizeof(s_addr));
s_addr.sin_family = AF_INET;
s_addr.sin_port = htons(port);
if (inet_aton(argv[1], (struct in_addr *)&s_addr.sin_addr.s_addr) == 0) {
perror(argv[1]);
exit(errno);
}
if(connect(sockfd,(struct sockaddr*)&s_addr,sizeof(struct sockaddr)) == -1){
perror("connect");
exit(errno);
}else
printf("*****************client start***************\n");
while(1){
bzero(buf,BUFLEN);
len = recv(sockfd,buf,BUFLEN,0);
if(len > 0)
printf("receive massage:%s\n",buf);
else{
if(len < 0 )
printf("receive failed\n");
else
printf("server stop\n");
break;
}
_retry:
bzero(buf,BUFLEN);
printf("enter your words:");
fgets(buf,BUFLEN,stdin);
//fputs(buf,stdout);
if(!strncasecmp(buf,"quit",4)){
printf("client stop\n");
break;
}
if(!strncmp(buf,"\n",1)){
goto _retry;
}
if(strchr(buf,'\n'))
len = send(sockfd,buf,strlen(buf)-1,0);
else
len = send(sockfd,buf,strlen(buf),0);
if(len > 0)
printf("send successful\n");
else{
printf("send failed\n");
break;
}
}
close(sockfd);
return 0;
}
然后分别编译:
gcc -o server server.c
gcc -o client server.c
然后安装tcpdump抓包工具并启动
sudo apt-get install tcpdump
sudo tcpdump -vvv -X -i lo tcp port 7777
然后开启第二个终端:
./server 127.0.0.1
然后开启第三个终端:
./client 127.0.0.1
当我们启动client就发现tcpdump工具进行了三次抓包: