文章目录

1. 理解TCP

1.1 了解TCP
1.2 分层实现
1.3 数据传输
1.4 TCP头部解析
1.5 TCP的三次握手、四次挥手
1.6 TCP的11种状态

2. 了解Socket

2.1 什么是Socket
2.2 Socket格式

3. 完整网络数据传输过程

1. 理解TCP

1.1 了解TCP

很多不同的厂家生产各种型号的计算机，它们运行完全不同的操作系统，但TCP/IP协议族允许它们互相进行通信。TCP/IP起源于60年代末美国政府资助的一个分组交换网络研究项目，到90年代已发展成为计算机之间最常应用的组网形式。
TCP（Transmission Control Protocol 传输控制协议）是一种面向连接的、可靠的、基于字节流的传输层通信协议。

1.2 分层实现

网络协议通常分不同层次进行开发，每一层分别负责不同的通信功能。一个协议族，如TCP/IP是一组不同层次上的多个协议的组合。TCP/IP通常被认为是一个四层协议系统。但是为了方便学习理解，国际标准化组织ISO 推出了OSI（Open System Interconnect ，开放系统互联） 七层参考模型。
在这里插入图片描述
以下我们使用OSI模型来说明：

物理层： 主要定义物理设备标准，如网线的接口类型、各种传输介质的传输速率等。主要作用是传输比特流（就是由1、0转化为电流强弱来进行传输，到达目的地后再转化为1、0，也就是常说的数模与模数转换）。这一层的数据叫做比特（bit），主要设备：集线器。
数据链路层： 主要将从物理层接收的数据进行MAC地址的封装与解封装。常把这层的数据叫做帧，主要设备：网卡，交换机。
网络层： 选择合适的网间路由和交换节点，确保数据及时传送，将从下层接收到数据进行 IP 地址的封装与解封装。通常把这一层数据叫做数据包，主要设备：路由器。
传输层： 定义了一些传输数据的协议和端口，如TCP、UDP协议，主要将从下层接收的数据进行分段和传输，到达目的地址后再进行重组，以往把这一层数据叫做段。
会话层： 通过传输层建立数据传输通路。在系统之间发起会话或者接受会话请求（设备之间需要相互认识）。
表示层： 主要是进行对接收的数据进行解释、压缩与解压缩等，即把计算机能够识别的东西转化为人能够识别的东西（如图片、声音等）。
应用层： 主要是一些终端的应用，比如说FTP（各种文件下载）、浏览器、QQ，以及域名系统DNS（将域名解析为IP，及其反解）等，可以将其理解为在电脑屏幕上可以看到的东西，也就是终端应用。

注：从上文介绍可以知道，发送数据时，在网络层会将IP（包含本机IP与目的机IP）进行封装，但是我们平时访问一个网站往往都是使用如：www.baidu.com 来访问网站，这时就需要 DNS 来将主机名解析为IP地址。若对这方面有兴趣可以看看 DNS & bind详解。

1.3 数据传输

在这里插入图片描述
我们需要知道 TCP 工作在网络OSI的七层模型中的传输层（Transport），IP在网络层（Network），ARP在数据链路层（Data Link）；在第二层上的数据，我们把它叫Frame(流)，在第三层上的数据叫Packet(包)，第四层的数据叫Segment(段)。同时，我们需要简单的知道，数据从应用层发下来，会在每一层都会加上头部信息，进行封装，然后再发送到数据接收端。这个基本的流程你需要知道，就是每个数据都会经过数据的封装和解封装的过程。

在OSI七层模型中，每一层的作用和对应的协议(部分)如下:
在这里插入图片描述

1.4 TCP头部解析

在这里插入图片描述
上面就是TCP协议头部的格式，由于它太重要了，是理解其它内容的基础，下面就将每个字段的信息都详细的说明一下。

Source Port和Destination Port： 分别占用16位，表示源端口号和目的端口号；用于区别主机中的不同进程，而IP地址是用来区分不同的主机的，源端口号和目的端口号配合上IP首部中的源IP地址和目的IP地址就能唯一的确定一个TCP连接。
Sequence Number： 用来标识从TCP发端向TCP收端发送的数据字节流，它表示在这个报文段中的的第一个数据字节在数据流中的序号，主要用来解决网络报乱序的问题。
Acknowledgment Number： 32位确认序列号包含发送确认的一端所期望收到的下一个序号，因此，确认序号应当是上次已成功收到数据字节序号加1。不过，只有当标志位中的ACK标志（下面介绍）为1时该确认序列号的字段才有效。主要用来解决不丢包的问题。
HeaderLength： 标识该TCP头部有多少个32bit字节(4字节)。因为4位最大能表示15，所以TCP头部最长是60字节。
Reserved： 6位保留。
Control bits： 6位标志位，包含如下几项：

URG：此标志表示TCP包的紧急指针域有效，用来保证TCP连接不被中断，并且督促中间层设备要尽快处理这些数据；
ACK：此标志表示应答域有效，就是说前面所说的TCP应答号将会包含在TCP数据包中；有两个取值：0和1，为1的时候表示应答域有效，反之为0；
PSH：这个标志位表示Push操作。所谓Push操作就是指在数据包到达接收端以后，立即传送给应用程序，而不是在缓冲区中排队；
RST：表示要求对方重新建立连接。用来复位那些产生错误的连接，也被用来拒绝错误和非法的数据包；
SYN：表示同步序号，用来建立连接。SYN标志位和ACK标志位搭配使用，当连接请求的时候，SYN=1，ACK=0；连接被响应的时候，SYN=1，ACK=1；这个标志的数据包经常被用来进行端口扫描。扫描者发送一个只有SYN的数据包，如果对方主机响应了一个数据包回来,就表明这台主机存在这个端口；但是由于这种扫描方式只是进行TCP三次握手的第一次握手，因此这种扫描的成功表示被扫描的机器不很安全，一台安全的主机将会强制要求一个连接严格的进行TCP的三次握手；
FIN：表示发送端已经达到数据末尾，也就是说双方的数据传送完成，没有数据可以传送了，发送FIN标志位的TCP数据包后，连接将被断开。这个标志的数据包也经常被用于进行端口扫描。

Window： 是TCP流控制的一个手段。这里说的窗口，指的是接收通告窗口。它告诉对方本端的TCP接收缓冲区还能容纳多少字节的数据，这样对方就可以控制发送数据的速度。
Checksum： 由发送端填充，接收端对TCP报文段执行CRC算法以检验TCP报文段在传输过程中是否损坏。注意，这个校验不仅包括TCP头部，也包括数据部分。这也是TCP可靠传输的一个重要保障。
Urgent： 是一个正的偏移量。它和序号字段的值相加表示最后一个紧急数据的下一字节的序号。因此，确切的说，这个字段是紧急指针相对当前序号的偏移，不妨称之为紧急偏移。TCP的紧急指针是发送端向接收端发送紧急数据的方法。

1.5 TCP的三次握手、四次挥手

在这里插入图片描述
三次握手：
1.建立连接时，客户端发送SYN包到服务器，其中包含客户端的初始序号seq=a，并进入SYN_SENT状态，等待服务器确认。（其中，SYN=1，ACK=0，表示这是一个TCP连接请求数据报文；序号seq=a，表明传输数据时的第一个数据字节的序号是a）。
2.服务器收到请求后，必须确认客户的数据包。同时自己也发送一个SYN包，即SYN+ACK包，此时服务器进入SYN_RECV状态。（其中确认报文段中，标识位SYN=1，ACK=1，表示这是一个TCP连接响应数据报文，并含服务端的初始序号seq(服务器)=b，以及服务器对客户端初始序号的确认号ack(服务器)=seq(客户端)+1=a+1）。
3.客户端收到服务器的SYN+ACK包，向服务器发送一个序列号(seq=a+1)，确认号为ack(客户端)=b+1，此包发送完毕，客户端和服务器进入ESTAB_LISHED(TCP连接成功)状态，完成三次握手。

疑问一： 从图中可以看出，明明两次握手就足以建立连接，为什么还要第三次握手呢？
两次握手就建立连接可能出现的问题：
如果一个连接请求在网络中跑的慢，超时了，这时客户端会重发请求，但是这个跑的慢的请求最后还是跑到了，然后服务端就接收了两个连接请求，然后全部回应就会创建两个连接，浪费资源！如果加了第三次客户端确认，客户端在接受到一个服务端连接确认请求后，后面再接收到的连接确认请求就可以抛弃不管了。

四次挥手：
1.首先客户端请求关闭客户端到服务端方向的连接，这时客户端就要发送FIN包，表示要关闭一个方向的连接（其中FIN=1，seq=x），此后客户端将不能像服务器发送数据，但可以接收服务端发来的数据。
2.服务端接收到后是需要确认一下的，所以返回了一个确认包（其中ACK=1，ack=x+1，seq=y），此时服务端会将未发送完的数据发送给客户端。
3.当所有数据发送完成后，服务端也向客户端发了一个 FIN 包（其中FIN=1，ack=x+1，seq=w），表示确认关闭。
4.客户端接收到后发送确认包（其中ACK=1，ack=w+1，seq=x+1），表示接受成功。但是此时TCP连接还没有释放，然后经过等待计时器设置的2MSL后，才进入到CLOSED状态。
四次分手完成！

疑问二： 为什么需要四次分手才能安全断开连接？
      因为TCP连接是全双工的,即双方都要停止连接才能安全断开。当第一次分手时，客户端变为FIN_WAIT1状态，此时客户端将不能再给服务器发送数据，但仍可接收来自服务器的数据。当服务器将给客户端的数据发送完毕后，服务器确认断开，双方都不能在发送数据。客户端将进入time_wait状态。
疑问三： 为什么客户端要等待2MSL后才进入CLOSED状态？
      首先，MSL即Maximum Segment Lifetime，就是最大报文生存时间，是任何报文在网络上的存在的最长时间，超过这个时间报文将被丢弃。《TCP/IP详解》中是这样描述的：MSL是任何报文段被丢弃前在网络内的最长时间。RFC 793中规定MSL为2分钟，实际应用中常用的是30秒、1分钟、2分钟等( /proc/sys/net/ipv4/tcp_fin_timeout参数)。
      TCP的TIME_WAIT需要等待2MSL，当TCP的一端发起主动关闭，三次挥手完成后发送第四次挥手的ACK包后就进入这个状态，等待2MSL时间主要目的是：防止最后一个ACK包对方没有收到，那么对方在超时后将重发第三次挥手的FIN包，主动关闭端接到重发的FIN包后可以再发一个ACK应答包。在TIME_WAIT状态时两端的端口不能使用，要等到2MSL时间结束才可以继续使用。当连接处于2MSL等待阶段时任何迟到的报文段都将被丢弃。

1.6 TCP的11种状态

CLOSED： 初始状态，表示TCP连接是"关闭着的"或"未打开的"。
LISTEN ： 表示服务器端的某个SOCKET处于监听状态，可以接受客户端的连接。
SYN_SENT： SYN_SENT 状态表示客户端已发送SYN报文。
SYN_RCVD： 表示服务器接收到了来自客户端请求连接的SYN报文。
ESTABLISHED： 表示TCP连接已经成功建立。
FIN_WAIT_1： 这个状态得好好解释一下，其实FIN_WAIT_1 和FIN_WAIT_2 两种状态的真正含义都是表示等待对方的FIN报文。而这两种状态的区别是：FIN_WAIT_1状态实际上是当SOCKET在ESTABLISHED状态时，它想主动关闭连接，向对方发送了FIN报文，此时该SOCKET进入到FIN_WAIT_1 状态。而当对方回应ACK报文后，则进入到FIN_WAIT_2 状态。当然在实际的正常情况下，无论对方处于任何种情况下，都应该马上回应ACK报文，所以FIN_WAIT_1 状态一般是比较难见到的，而FIN_WAIT_2 状态有时仍可以用netstat看到。
FIN_WAIT_2： 上面已经解释了这种状态的由来，实际上FIN_WAIT_2状态下的SOCKET表示半连接，即有一方调用close()主动要求关闭连接。注意：FIN_WAIT_2 是没有超时的（不像TIME_WAIT 状态），这种状态下如果对方不关闭（不配合完成4次挥手过程），那这个 FIN_WAIT_2 状态将一直保持到系统重启，越来越多的FIN_WAIT_2 状态会导致内核crash。
TIME_WAIT： 表示收到了对方的FIN报文，并发送出了ACK报文。
CLOSING： 这种状态在实际情况中应该很少见，属于一种比较罕见的例外状态。正常情况下，当一方发送FIN报文后，按理来说是应该先收到（或同时收到）对方的ACK报文，再收到对方的FIN报文。但是CLOSING 状态表示一方发送FIN报文后，并没有收到对方的ACK报文，反而却也收到了对方的FIN报文。什么情况下会出现此种情况呢？那就是当双方几乎在同时close()一个SOCKET的话，就出现了双方同时发送FIN报文的情况，这是就会出现CLOSING 状态，表示双方都正在关闭SOCKET连接。
CLOSE_WAIT： 表示正在等待关闭。怎么理解呢？当对方close()一个SOCKET后发送FIN报文给自己，你的系统毫无疑问地将会回应一个ACK报文给对方，此时TCP连接则进入到CLOSE_WAIT状态。接下来呢，你需要检查自己是否还有数据要发送给对方，如果没有的话，那你也就可以close()这个SOCKET并发送FIN报文给对方，即关闭自己到对方这个方向的连接。有数据的话则看程序的策略，继续发送或丢弃。简单地说，当你处于CLOSE_WAIT 状态下，需要完成的事情是等待你去关闭连接。
LAST_ACK： 当被动关闭的一方在发送FIN报文后，等待对方的ACK报文的时候，就处于LAST_ACK 状态。当收到对方的ACK报文后，也就可以进入到CLOSED 可用状态了。

2. 了解Socket

2.1 什么是Socket

从上文可知，应用层数据经过重重封装，通过网卡发送出去，通过网络最终到达目的主机。在这个过程中，网络层会将源IP，目的IP添加进头部。传输层会将源端口，目的端口添加进头部，这几个信息是能否准确传输数据的关键，那么这些数据靠谁来维护呢？这就需要我们的 Socket，也称为网络套接字。
现在的两台主机间通信，准确的说其实是两台主机上的两个进程进行通信，当两台主机建立起TCP连接时，就会在两台主机上分别生成一个Socket文件，并由内核进行维护。

2.2 Socket格式

完整的套接字格式：
      protocol ： TCP/UDP
      src_addr： 源IP
      src_port ： 源port
      dest_addr： 目的IP
      dest_port ： 目的port

这常被称为套接字的五元组。这些内容是在创建TCP连接时，就已经绑定。

3. 完整网络数据传输过程

在这里插入图片描述
以右侧为浏览器，左侧为httpd服务器为例。

1.当httpd服务收到浏览器发送的index.html文件的请求时，负责处理请求的httpd子进程/线程总是会先发起系统调用，让内核将index.html从存储设备中加载出来。但是加载到的位置是内核空间的缓冲区kernel buffer，而不是直接给进程/线程的内存区。由于是内存设备和存储设备之间的数据传输，没有CPU的参与，所以这次是DMA（直接内存存取）操作。
2.当数据准备好后，内核唤醒httpd子进程/线程，将kernel buffer的数据拷贝到自己的缓冲区，也就是图中的app buffer。到了app buffer中的数据，已经独属于进程/线程，也就可以对它做读取、修改等等操作。由于这次是使用CPU来复制的，所以会消耗CPU资源。由于这个阶段从内核空间切换到用户空间，所以进行了上下文切换。
3.当数据修改完成(也可能没做任何操作)后，按我们所想的，需要把它响应给浏览器，也就是说要通过TCP连接传输出去。但TCP协议栈有自己的缓冲区，要通过它发送数据，必须将数据写到它的buffer中，对于发送者就是send buffer，对于接受者就是recv buffer。于是，数据将再次从app buffer复制到send buffer。这次也是CPU参与进行的复制，所以会消耗CPU。同样也会进行上下文切换。
4.非本机数据最终还是会通过网卡传输出去的，所以将send buffer中的数据交给网卡并通过网卡传输出去。由于这次是内存和设备之间的数据传输，没有CPU的参与，所以这次也是DMA操作。
5.当浏览器所在主机的网卡收到响应数据后(当然，数据是源源不断传输的)，将它传输到TCP的recv buffer。这次是DMA操作。
6.数据源源不断地填充到recv buffer中，但是浏览器却不一定会去读取，而是需要通知浏览器进程将数据从read buffer中取走。这次是CPU操作。

注：内存与硬件之间的IO操作可以不需要CPU的参数，但是内存与内存之间的IO操作必须有CPU参与。

了解TCP与Socket