了解TCP与Socket

1. 理解TCP

1.1 了解TCP

      很多不同的厂家生产各种型号的计算机,它们运行完全不同的操作系统,但TCP/IP协议族允许它们互相进行通信。TCP/IP起源于60年代末美国政府资助的一个分组交换网络研究项目,到90年代已发展成为计算机之间最常应用的组网形式。
      TCP(Transmission Control Protocol 传输控制协议)是一种面向连接的、可靠的、基于字节流的传输层通信协议。

1.2 分层实现

      网络协议通常分不同层次进行开发,每一层分别负责不同的通信功能。一个协议族,如TCP/IP是一组不同层次上的多个协议的组合。TCP/IP通常被认为是一个四层协议系统。但是为了方便学习理解,国际标准化组织ISO 推出了OSI(Open System Interconnect ,开放系统互联) 七层参考模型。
在这里插入图片描述
以下我们使用OSI模型来说明:

物理层: 主要定义物理设备标准,如网线的接口类型、各种传输介质的传输速率等。主要作用是传输比特流(就是由1、0转化为电流强弱来进行传输,到达目的地后再转化为1、0,也就是常说的数模与模数转换)。这一层的数据叫做比特(bit),主要设备:集线器。
数据链路层: 主要将从物理层接收的数据进行MAC地址的封装与解封装。常把这层的数据叫做帧,主要设备:网卡,交换机。
网络层: 选择合适的网间路由和交换节点,确保数据及时传送,将从下层接收到数据进行 IP 地址的封装与解封装。通常把这一层数据叫做数据包,主要设备:路由器。
传输层: 定义了一些传输数据的协议和端口,如TCP、UDP协议,主要将从下层接收的数据进行分段和传输,到达目的地址后再进行重组,以往把这一层数据叫做段。
会话层: 通过传输层建立数据传输通路。在系统之间发起会话或者接受会话请求(设备之间需要相互认识)。
表示层: 主要是进行对接收的数据进行解释、压缩与解压缩等,即把计算机能够识别的东西转化为人能够识别的东西(如图片、声音等)。
应用层: 主要是一些终端的应用,比如说FTP(各种文件下载)、浏览器、QQ,以及域名系统DNS(将域名解析为IP,及其反解)等,可以将其理解为在电脑屏幕上可以看到的东西,也就是终端应用。

注: 从上文介绍可以知道,发送数据时,在网络层会将IP(包含本机IP与目的机IP)进行封装,但是我们平时访问一个网站往往都是使用如:www.baidu.com 来访问网站,这时就需要 DNS 来将主机名解析为IP地址。若对这方面有兴趣可以看看 DNS & bind详解

1.3 数据传输

在这里插入图片描述
      我们需要知道 TCP 工作在网络OSI的七层模型中的传输层(Transport),IP在网络层(Network),ARP在数据链路层(Data Link);在第二层上的数据,我们把它叫Frame(流),在第三层上的数据叫Packet(包),第四层的数据叫Segment(段)。 同时,我们需要简单的知道,数据从应用层发下来,会在每一层都会加上头部信息,进行封装,然后再发送到数据接收端。这个基本的流程你需要知道,就是每个数据都会经过数据的封装和解封装的过程。

在OSI七层模型中,每一层的作用和对应的协议(部分)如下:
在这里插入图片描述

1.4 TCP头部解析

在这里插入图片描述
      上面就是TCP协议头部的格式,由于它太重要了,是理解其它内容的基础,下面就将每个字段的信息都详细的说明一下。

Source Port和Destination Port: 分别占用16位,表示源端口号和目的端口号;用于区别主机中的不同进程,而IP地址是用来区分不同的主机的,源端口号和目的端口号配合上IP首部中的源IP地址和目的IP地址就能唯一的确定一个TCP连接。
Sequence Number: 用来标识从TCP发端向TCP收端发送的数据字节流,它表示在这个报文段中的的第一个数据字节在数据流中的序号,主要用来解决网络报乱序的问题。
Acknowledgment Number: 32位确认序列号包含发送确认的一端所期望收到的下一个序号,因此,确认序号应当是上次已成功收到数据字节序号加1。不过,只有当标志位中的ACK标志(下面介绍)为1时该确认序列号的字段才有效。主要用来解决不丢包的问题。
HeaderLength: 标识该TCP头部有多少个32bit字节(4字节)。因为4位最大能表示15,所以TCP头部最长是60字节。
Reserved: 6位保留。
Control bits: 6位标志位,包含如下几项:

  • URG: 此标志表示TCP包的紧急指针域有效,用来保证TCP连接不被中断,并且督促中间层设备要尽快处理这些数据;
  • ACK:此标志表示应答域有效,就是说前面所说的TCP应答号将会包含在TCP数据包中;有两个取值:0和1,为1的时候表示应答域有效,反之为0;
  • PSH:这个标志位表示Push操作。所谓Push操作就是指在数据包到达接收端以后,立即传送给应用程序,而不是在缓冲区中排队;
  • RST:表示要求对方重新建立连接。用来复位那些产生错误的连接,也被用来拒绝错误和非法的数据包;
  • SYN:表示同步序号,用来建立连接。SYN标志位和ACK标志位搭配使用,当连接请求的时候,SYN=1,ACK=0;连接被响应的时候,SYN=1,ACK=1;这个标志的数据包经常被用来进行端口扫描。扫描者发送一个只有SYN的数据包,如果对方主机响应了一个数据包回来,就表明这台主机存在这个端口;但是由于这种扫描方式只是进行TCP三次握手的第一次握手,因此这种扫描的成功表示被扫描的机器不很安全,一台安全的主机将会强制要求一个连接严格的进行TCP的三次握手;
  • FIN:表示发送端已经达到数据末尾,也就是说双方的数据传送完成,没有数据可以传送了,发送FIN标志位的TCP数据包后,连接将被断开。这个标志的数据包也经常被用于进行端口扫描。

Window: 是TCP流控制的一个手段。这里说的窗口,指的是接收通告窗口。它告诉对方本端的TCP接收缓冲区还能容纳多少字节的数据,这样对方就可以控制发送数据的速度。
Checksum: 由发送端填充,接收端对TCP报文段执行CRC算法以检验TCP报文段在传输过程中是否损坏。注意,这个校验不仅包括TCP头部,也包括数据部分。这也是TCP可靠传输的一个重要保障。
Urgent: 是一个正的偏移量。它和序号字段的值相加表示最后一个紧急数据的下一字节的序号。因此,确切的说,这个字段是紧急指针相对当前序号的偏移,不妨称之为紧急偏移。TCP的紧急指针是发送端向接收端发送紧急数据的方法。

1.5 TCP的三次握手、四次挥手

在这里插入图片描述
三次握手:
1.建立连接时,客户端发送SYN包到服务器,其中包含客户端的初始序号seq=a,并进入SYN_SENT状态,等待服务器确认。(其中,SYN=1,ACK=0,表示这是一个TCP连接请求数据报文;序号seq=a,表明传输数据时的第一个数据字节的序号是a)。
2.服务器收到请求后,必须确认客户的数据包。同时自己也发送一个SYN包,即SYN+ACK包,此时服务器进入SYN_RECV状态。(其中确认报文段中,标识位SYN=1,ACK=1,表示这是一个TCP连接响应数据报文,并含服务端的初始序号seq(服务器)=b,以及服务器对客户端初始序号的确认号ack(服务器)=seq(客户端)+1=a+1)。
3.客户端收到服务器的SYN+ACK包,向服务器发送一个序列号(seq=a+1),确认号为ack(客户端)=b+1,此包发送完毕,客户端和服务器进入ESTAB_LISHED(TCP连接成功)状态,完成三次握手。

疑问一: 从图中可以看出,明明两次握手就足以建立连接,为什么还要第三次握手呢?
两次握手就建立连接可能出现的问题:
      如果一个连接请求在网络中跑的慢,超时了,这时客户端会重发请求,但是这个跑的慢的请求最后还是跑到了,然后服务端就接收了两个连接请求,然后全部回应就会创建两个连接,浪费资源!如果加了第三次客户端确认,客户端在接受到一个服务端连接确认请求后,后面再接收到的连接确认请求就可以抛弃不管了。


四次挥手:
1.首先客户端请求关闭客户端到服务端方向的连接,这时客户端就要发送FIN包,表示要关闭一个方向的连接(其中FIN=1,seq=x),此后客户端将不能像服务器发送数据,但可以接收服务端发来的数据。
2.服务端接收到后是需要确认一下的,所以返回了一个确认包(其中ACK=1,ack=x+1,seq=y),此时服务端会将未发送完的数据发送给客户端。
3.当所有数据发送完成后,服务端也向客户端发了一个 FIN 包(其中FIN=1,ack=x+1,seq=w),表示确认关闭。
4.客户端接收到后发送确认包(其中ACK=1,ack=w+1,seq=x+1),表示接受成功。但是此时TCP连接还没有释放,然后经过等待计时器设置的2MSL后,才进入到CLOSED状态。
四次分手完成!

疑问二: 为什么需要四次分手才能安全断开连接?
      因为TCP连接是全双工的,即双方都要停止连接才能安全断开。当第一次分手时,客户端变为FIN_WAIT1状态,此时客户端将不能再给服务器发送数据,但仍可接收来自服务器的数据。当服务器将给客户端的数据发送完毕后,服务器确认断开,双方都不能在发送数据。客户端将进入time_wait状态。
疑问三: 为什么客户端要等待2MSL后才进入CLOSED状态?
      首先,MSL即Maximum Segment Lifetime,就是最大报文生存时间,是任何报文在网络上的存在的最长时间,超过这个时间报文将被丢弃。《TCP/IP详解》中是这样描述的:MSL是任何报文段被丢弃前在网络内的最长时间。RFC 793中规定MSL为2分钟,实际应用中常用的是30秒、1分钟、2分钟等( /proc/sys/net/ipv4/tcp_fin_timeout参数)。
      TCP的TIME_WAIT需要等待2MSL,当TCP的一端发起主动关闭,三次挥手完成后发送第四次挥手的ACK包后就进入这个状态,等待2MSL时间主要目的是:防止最后一个ACK包对方没有收到,那么对方在超时后将重发第三次挥手的FIN包,主动关闭端接到重发的FIN包后可以再发一个ACK应答包。在TIME_WAIT状态时两端的端口不能使用,要等到2MSL时间结束才可以继续使用。当连接处于2MSL等待阶段时任何迟到的报文段都将被丢弃。

1.6 TCP的11种状态

CLOSED: 初始状态,表示TCP连接是"关闭着的"或"未打开的"。
LISTEN : 表示服务器端的某个SOCKET处于监听状态,可以接受客户端的连接。
SYN_SENT: SYN_SENT 状态表示客户端已发送SYN报文。
SYN_RCVD: 表示服务器接收到了来自客户端请求连接的SYN报文。
ESTABLISHED: 表示TCP连接已经成功建立。
FIN_WAIT_1: 这个状态得好好解释一下,其实FIN_WAIT_1 和FIN_WAIT_2 两种状态的真正含义都是表示等待对方的FIN报文。而这两种状态的区别是:FIN_WAIT_1状态实际上是当SOCKET在ESTABLISHED状态时,它想主动关闭连接,向对方发送了FIN报文,此时该SOCKET进入到FIN_WAIT_1 状态。而当对方回应ACK报文后,则进入到FIN_WAIT_2 状态。当然在实际的正常情况下,无论对方处于任何种情况下,都应该马上回应ACK报文,所以FIN_WAIT_1 状态一般是比较难见到的,而FIN_WAIT_2 状态有时仍可以用netstat看到。
FIN_WAIT_2: 上面已经解释了这种状态的由来,实际上FIN_WAIT_2状态下的SOCKET表示半连接,即有一方调用close()主动要求关闭连接。注意:FIN_WAIT_2 是没有超时的(不像TIME_WAIT 状态),这种状态下如果对方不关闭(不配合完成4次挥手过程),那这个 FIN_WAIT_2 状态将一直保持到系统重启,越来越多的FIN_WAIT_2 状态会导致内核crash。
TIME_WAIT: 表示收到了对方的FIN报文,并发送出了ACK报文。
CLOSING: 这种状态在实际情况中应该很少见,属于一种比较罕见的例外状态。正常情况下,当一方发送FIN报文后,按理来说是应该先收到(或同时收到)对方的ACK报文,再收到对方的FIN报文。但是CLOSING 状态表示一方发送FIN报文后,并没有收到对方的ACK报文,反而却也收到了对方的FIN报文。什么情况下会出现此种情况呢?那就是当双方几乎在同时close()一个SOCKET的话,就出现了双方同时发送FIN报文的情况,这是就会出现CLOSING 状态,表示双方都正在关闭SOCKET连接。
CLOSE_WAIT: 表示正在等待关闭。怎么理解呢?当对方close()一个SOCKET后发送FIN报文给自己,你的系统毫无疑问地将会回应一个ACK报文给对方,此时TCP连接则进入到CLOSE_WAIT状态。接下来呢,你需要检查自己是否还有数据要发送给对方,如果没有的话,那你也就可以close()这个SOCKET并发送FIN报文给对方,即关闭自己到对方这个方向的连接。有数据的话则看程序的策略,继续发送或丢弃。简单地说,当你处于CLOSE_WAIT 状态下,需要完成的事情是等待你去关闭连接。
LAST_ACK: 当被动关闭的一方在发送FIN报文后,等待对方的ACK报文的时候,就处于LAST_ACK 状态。当收到对方的ACK报文后,也就可以进入到CLOSED 可用状态了。

2. 了解Socket

2.1 什么是Socket

      从上文可知,应用层数据经过重重封装,通过网卡发送出去,通过网络最终到达目的主机。在这个过程中,网络层会将源IP,目的IP添加进头部。传输层会将源端口,目的端口添加进头部,这几个信息是能否准确传输数据的关键,那么这些数据靠谁来维护呢?这就需要我们的 Socket,也称为网络套接字
      现在的两台主机间通信,准确的说其实是两台主机上的两个进程进行通信,当两台主机建立起TCP连接时,就会在两台主机上分别生成一个Socket文件,并由内核进行维护。

2.2 Socket格式

完整的套接字格式:
      protocol : TCP/UDP
      src_addr: 源IP
      src_port : 源port
      dest_addr: 目的IP
      dest_port : 目的port

这常被称为套接字的五元组。这些内容是在创建TCP连接时,就已经绑定。

3. 完整网络数据传输过程

在这里插入图片描述
以右侧为浏览器,左侧为httpd服务器为例。

1.当httpd服务收到浏览器发送的index.html文件的请求时,负责处理请求的httpd子进程/线程总是会先发起系统调用,让内核将index.html从存储设备中加载出来。但是加载到的位置是内核空间的缓冲区kernel buffer,而不是直接给进程/线程的内存区。由于是内存设备和存储设备之间的数据传输,没有CPU的参与,所以这次是DMA(直接内存存取)操作。
2.当数据准备好后,内核唤醒httpd子进程/线程,将kernel buffer的数据拷贝到自己的缓冲区,也就是图中的app buffer。到了app buffer中的数据,已经独属于进程/线程,也就可以对它做读取、修改等等操作。由于这次是使用CPU来复制的,所以会消耗CPU资源。由于这个阶段从内核空间切换到用户空间,所以进行了上下文切换。
3.当数据修改完成(也可能没做任何操作)后,按我们所想的,需要把它响应给浏览器,也就是说要通过TCP连接传输出去。但TCP协议栈有自己的缓冲区,要通过它发送数据,必须将数据写到它的buffer中,对于发送者就是send buffer,对于接受者就是recv buffer。于是,数据将再次从app buffer复制到send buffer。这次也是CPU参与进行的复制,所以会消耗CPU。同样也会进行上下文切换。
4.非本机数据最终还是会通过网卡传输出去的,所以将send buffer中的数据交给网卡并通过网卡传输出去。由于这次是内存和设备之间的数据传输,没有CPU的参与,所以这次也是DMA操作。
5.当浏览器所在主机的网卡收到响应数据后(当然,数据是源源不断传输的),将它传输到TCP的recv buffer。这次是DMA操作。
6.数据源源不断地填充到recv buffer中,但是浏览器却不一定会去读取,而是需要通知浏览器进程将数据从read buffer中取走。这次是CPU操作。

注:内存与硬件之间的IO操作可以不需要CPU的参数,但是内存与内存之间的IO操作必须有CPU参与。

猜你喜欢

转载自blog.csdn.net/rightlzc/article/details/83860923