网络协议分层

一直用TCP套接字做游戏服务器的网络通信，关于网络分层的原理却很模糊，最近好好看了一些网络分层的文章，把觉得重要的点整合了一下。

众所周知的网络分层中的OSI七层模型，如下（第七层到第一层）：

应用层

表示层

会话层

传输层

网络层

数据链路层

物理层

而实际中按TCP/IP的协议分层的5层网络架构：

应用层
传输层
互联网层
网络接口层
物理层

也有TCP/IP参考模型分为四层：应用层、传输层、网络互连层和主机到网络层。

下面主要说5层架构中每一层的作用以及各层的常使用的协议：

一、物理层（实体层）

用光缆、电缆、双绞线、无线电波等方式把PC机、互连网服务器、网络设备等连接起来。这就是物理层，也叫做”实体层”。它主要规定了网络的一些电气特性，使这些设备都能够互相连接并兼容使用。它的主要作用是负责传送0和1的电信号。

二、数据链路层（链接层/网络接口层）

这层确定了0和1这些电信号的分组方式。定义如何使用实际网络（如Ethernet、Serial Line等）来传送数据。

下面是数据链路层的几个名词：

以太网协议：

"以太网"（Ethernet）协议，规定电信号分组方式：一组电信号构成一个数据包，叫做”帧”（Frame）。每一帧分成两个部分：标头（Head）和数据（Data）。

“标头”包含数据包的一些说明项，比如发送者、接受者、数据类型等等；”数据”则是数据包的具体内容。

“标头”的长度，固定为18字节。”数据”的长度，最短为46字节，最长为1500字节。因此，整个”帧”最短为64字节，最长为1518字节。如果数据很长，就必须分割成多个帧进行发送。

MAC地址

以太网规定，连入网络的所有设备，都必须具有”网卡”接口。数据包必须是从一块网卡，传送到另一块网卡。网卡的地址，就是数据包的发送地址和接收地址，这叫做MAC地址。以太网数据包的”标头”，包含的发送者和接受者的信息，就是MAC地址。

每块网卡都有一个全世界独一无二的MAC地址，长度是48个二进制位，通常用12个十六进制数表示（6个字节），类似这样：40-8D-5D-FE-71-70。前6个十六进制数是厂商编号，后6个是该厂商的网卡流水号。有了MAC地址，就可以定位网卡和数据包的路径了。

广播

一块网卡如何知道另一块网卡的MAC地址，在网络层会详细解释，是通过ARP协议。以太网数据包必须知道接收方的MAC地址，然后才能发送。

有了MAC地址，系统如何把数据包准确送到接收方？

这里以太网采用了一种很”原始”的方式，它不是把数据包准确送到接收方，而是向本网络内所有计算机发送，让每台计算机自己判断，是否为接收方。

例如：1号计算机向2号计算机发送一个数据包，和2号在同一个子网络的3号、4号、5号计算机都会收到这个包。它们读取这个包的”标头”，通过ARP协议，由IP地址找到接收方的MAC地址，然后与自身的MAC地址相比较，如果两者相同，就接受这个包，做进一步处理，否则就丢弃这个包。这种发送方式就叫做”广播”（broadcasting）。

有了数据包的定义、网卡的MAC地址、广播的发送方式，”链接层”就可以在多台计算机之间传送数据了。

三、网络层

网络层由来：

以太网协议，依靠MAC地址发送数据。理论上，单单依靠MAC地址，不同的网卡在局域网内可以通信。但这样做有个重大的缺点。以太网采用广播方式发送数据包，所有局域网内的计算机都会收到包，不仅效率低，而且局限在发送者所在的子网络。也就是说，如果两台计算机不在同一个子网络，广播是传不过去的。互联网是无数子网络共同组成的一个巨型网络，不同地域的电脑在一个子网络，这几乎是不可能的。

因此，必须找到一种方法，能够区分哪些MAC地址属于同一个子网络，哪些不是。如果是同一个子网络，就采用广播方式发送，否则就采用”路由”方式发送。（”路由”的意思，就是指如何向不同的子网络分发数据包）而MAC地址本身无法做到这一点。它只与厂商有关，与所处网络无关。

这就导致了”网络层”的诞生。它的作用是引进一套新的地址，使得我们能够区分不同的计算机是否属于同一个子网络。这套地址就叫做”网络地址”，简称”网址”，也就是IP。

于是，”网络层”出现以后，每台计算机有两种地址，一种是MAC地址，另一种是网络地址（IP）。两种地址之间没有任何联系，MAC地址是绑定在网卡上的，网络地址则是管理员分配的，它们只是随机组合在一起。

网络地址（IP）确定计算机所在的子网络，MAC地址则将数据包送到该子网络中的目标网卡。因此，从逻辑上可以推断，必定是先处理网络地址，然后再处理MAC地址。

网络层作用：

IP层接收由网络接口层发来的数据包，并把该数据包发送到更高层—传输层；相反，IP层也把从传输层接收来的数据包传送到更低层。IP数据包是不可靠的，因为IP并没有做任何事情来确认数据包是按顺序发送的或者没有被破坏。IP数据包中含有发送它的主机的地址（源地址）和接收它的主机的地址（目的地址）。

传输层的TCP和UDP服务在接收数据包时，通常假设包中的源地址是有效的。也可以这样说，IP地址形成了许多服务的认证基础，这些服务相信数据包是从一个有效的主机发送来的。IP确认包含一个选项，叫作IP source routing，可以用来指定一条源地址和目的地址之间的直接路径。对于一些TCP和UDP的服务来说，使用了该选项的IP包好像是从路径上的最后一个系统传递过来的，而不是来自于它的真实地点。这个选项是为了测试而存在的，说明了它可以被用来欺骗系统来进行平常是被禁止的连接。那么，许多依靠IP源地址做确认的服务将产生问题并且会被非法入侵。

IP（Internet Protocol）协议

规定网络地址的协议，叫做IP协议。它所定义的地址，就被称为IP地址。IP协议规定了数据传输时的基本单元和格式。目前，广泛采用的是IP协议第四版，简称IPv4。这个版本规定，网络地址由32个二进制位组成。习惯上，我们用分成四段的十进制数表示IP地址，从0.0.0.0一直到255.255.255.255。

互联网上的每一台计算机，都会分配到一个IP地址。这个地址分成两个部分，前一部分代表网络，后一部分代表主机。比如，IP地址172.16.254.1，这是一个32位的地址，假定它的网络部分是前24位（172.16.254），那么主机部分就是后8位（最后的那个1）。处于同一个子网络的电脑，它们IP地址的网络部分必定是相同的，也就是说172.16.254.2应该与172.16.254.1处在同一个子网络。

但是，问题在于单单从IP地址，我们无法判断网络部分是多少位，主机是多少位，无法判断两台计算机是否属于同一个子网络。这里要用另一个参数”子网掩码”（subnet mask）。

所谓”子网掩码”，就是表示子网络特征的一个参数。它在形式上等同于IP地址，也是一个32位二进制数字，它的网络部分全部为1，主机部分全部为0。比如，IP地址172.16.254.1，如果已知网络部分是前24位，主机部分是后8位，那么子网络掩码就是11111111.11111111.11111111.00000000，写成十进制就是255.255.255.0。知道”子网掩码”，我们就能判断，任意两个IP地址是否处在同一个子网络。方法是将两个IP地址与子网掩码分别进行AND运算（两个数位都为1，运算结果为1，否则为0），然后比较结果是否相同，如果是的话，就表明它们在同一个子网络中，否则就不是。

比如，已知IP地址172.16.254.1和172.16.254.233的子网掩码都是255.255.255.0，请问它们是否在同一个子网络？两者与子网掩码分别进行AND运算，结果都是172.16.254.0，因此它们在同一个子网络。

总结一下，IP协议的作用主要有两个，一个是为每一台计算机分配IP地址，另一个是确定哪些地址在同一个子网络。

IP数据包

根据IP协议发送的数据，就叫做IP数据包。其中包括IP地址信息。但是前面说过，以太网数据包只包含MAC地址，并没有IP地址的栏位。这里也不需要修改数据定义，我们可以把IP数据包直接放进以太网数据包的”数据”部分。这就是互联网分层结构的好处：上层的变动完全不涉及下层的结构。

具体来说，IP数据包也分为”标头”和”数据”两个部分。

“标头”部分主要包括版本、长度、IP地址等信息，”数据”部分则是IP数据包的具体内容。它放进以太网数据包后，以太网数据包就变成了下面这样。

IP数据包的”标头”部分的长度为20到60字节，整个数据包的总长度最大为65,535字节。因此，理论上，一个IP数据包的”数据”部分，最长为65,515字节。前面说过，以太网数据包的”数据”部分，最长只有1500字节。因此，如果IP数据包超过了1500字节，它就需要分割成几个以太网数据包，分开发送了（多个帧）。

ARP协议

地址解析协议，即ARP（Address ResolutionProtocol），是根据IP地址获取物理地址的一个TCP/IP协议。（因为这个协议的工作内容是链接层的，所以有的人将其算作链接层的协议，但其实是在网络层工作的，根据IP地址获取MAC地址）

因为IP数据包是放在以太网数据包里发送的，所以我们必须同时知道两个地址，一个是对方的MAC地址，另一个是对方的IP地址。通常情况下，对方的IP地址是已知的，但是我们不知道它的MAC地址。所以，我们需要一种机制，能够从IP地址得到MAC地址。

这里又可以分成两种情况。第一种情况，如果两台主机不在同一个子网络，那么事实上没有办法得到对方的MAC地址，只能把数据包传送到两个子网络连接处的”网关”（gateway），让网关去处理。

第二种情况，如果两台主机在同一个子网络，那么我们可以用ARP协议，得到对方的MAC地址。ARP协议也是发出一个数据包（包含在以太网数据包中），其中包含它所要查询主机的IP地址，在对方的MAC地址这一栏，填的是FF:FF:FF:FF:FF:FF，表示这是一个”广播”地址。它所在子网络的每一台主机，都会收到这个数据包，从中取出IP地址，与自身的IP地址进行比较。如果两者相同，都做出回复，向对方报告自己的MAC地址，否则就丢弃这个包。

总之，有了ARP协议之后，我们就可以得到同一个子网络内的主机MAC地址，可以把数据包发送到任意一台主机之上了。

与ARP一对的，RARP协议（Reverse Address Resolution Protocol），反向地址转换协议。反向地址转换协议就是将局域网中某个主机的物理地址转换为IP地址，现在基本上RARP被淘汰了，DHCP协议对RARP做了提升。

DHCP属于应用层协议，并且使用的是UDP协议的应用层协议。

DHCP（Dynamic HostConfiguration Protocol，动态主机配置协议）通常被应用在大型的局域网络环境中，主要作用是集中的管理、分配IP地址，使网络环境中的主机动态的获得IP地址、Gateway地址、DNS服务器地址等信息，并能够提升地址的使用率。

DHCP协议采用客户端/服务器模型，主机地址的动态分配任务由网络主机驱动。当DHCP服务器接收到来自网络主机申请地址的信息时，才会向网络主机发送相关的地址配置等信息，以实现网络主机地址信息的动态配置。DHCP具有以下功能：

1. 保证任何IP地址在同一时刻只能由一台DHCP客户机所使用。

2. DHCP应当可以给用户分配永久固定的IP地址。

3. DHCP应当可以同用其他方法获得IP地址的主机共存（如手工配置IP地址的主机）。

四、传输层

有了MAC地址和IP地址，我们已经可以在互联网上任意两台主机上建立通信。通常同一台主机上有许多程序都需要用到网络，因此还需要一个参数，表示这个数据包到底供哪个程序（进程）使用。这个参数就叫做”端口”（port），它其实是每一个使用网卡的程序的编号。每个数据包都发到主机的特定端口，所以不同的程序就能取到自己所需要的数据。

“端口”是0到65535之间的一个整数，正好16个二进制位。0到1023的端口被系统占用，用户只能选用大于1023的端口。不管是浏览网页还是在线聊天，应用程序会随机选用一个端口，然后与服务器的相应端口联系。服务进程通常使用一个固定的端口，例如，SMTP使用25、Xwindows使用6000。这些端口号是‘广为人知’的，因为在建立与特定的主机或服务的连接时，需要这些地址和目的地址进行通讯。

传输层的功能，就是建立”端口到端口”的通信。相比之下，”网络层”的功能是建立”主机到主机”的通信。只要确定主机和端口，我们就能实现程序之间的交流。因此，Unix系统就把主机+端口，叫做”套接字”（socket）。利用套接字可以进行网络应用程序的开发。

传输层提供了节点间的数据传送服务，主要协议：传输控制协议（TCP）、用户数据报协议（UDP）等，TCP和UDP给数据包加入传输数据并把它传输到下一层中，这一层负责传送数据，并且确定数据已被送达并接收。

UDP与TCP的区别：UDP是不面向连接的，不可靠的协议；TCP是面向连接的，可靠的传输协议。那么为什么？

首先有个信道复用的概念：  1、频分复用    2、时分复用    3、波分复用    4、码分复用    5、空分复用    6、统计复用    7、极化波复用。不同的信道复用技术，使用不同的复用技术，目的就是创建“虚拟信道”。
   一个TCP协议连接其实就是在物理线路上创建的一条“虚拟信道”。这条“虚拟信道”建立后，在TCP协议发出FIN包之前（两个终端都会向对方发送一个FIN包），是不会释放的。正因为这一点，TCP协议被称为面向连接的协议！
   UDP协议，一样会在物理线路上创建一条“虚拟信道”，否则UDP协议无法传输数据！但是，当UDP协议传完数据后，这条“虚拟信道”就被立即注销了！因此，称UDP是不面向连接的协议！（注意：一种物理线路，单位时间内，能够创建的“虚拟信道”是有限的）.

使用TCP协议传输数据，当数据从A端传到B端后，B端会发送一个确认包（ACK包）给A端，告知A端数据我已收到！UDP协议就没有这种确认机制！这就是为什么说TCP协议可靠，UDP协议不可靠.

UDP协议

UDP协议，它的格式几乎就是在数据前面，加上端口号。UDP数据包，也是由”标头”和”数据”两部分组成。”标头”部分一共只有8个字节，总长度不超过65,535字节，正好放进一个IP数据包。

“标头”部分主要定义了发出端口和接收端口，”数据”部分就是具体的内容。然后，把整个UDP数据包放入IP数据包的”数据”部分，而前面说过，IP数据包又是放在以太网数据包之中的，所以整个以太网数据包现在变成了下面这样：

UDP与TCP位于同一层，但对于数据包的顺序错误不重发。因此，UDP不被应用于那些使用虚电路的面向连接的服务，UDP主要用于那些面向查询---应答的服务，例如NFS。相对于FTP或Telnet，这些服务需要交换的信息量较小。使用UDP的服务包括NTP（网络时间协议）和DNS（DNS也使用TCP）。

UDP没有建立初始化连接（三次握手）（因为在两个系统间没有虚电路），也就是说，与UDP相关的服务面临着更大的危险。

TCP协议

TCP协议提供了可靠的面向对象的数据流传输服务的规则和约定。简单的说在TCP模式中，对方发一个数据包给你，你要发一个确认数据包给对方。通过这种确认机制来提供可靠性。如果有一个数据包遗失，就收不到确认，发出方就知道有必要重发这个数据包了。因此，TCP协议能够确保数据不会遗失。如果IP数据包中有已经封好的TCP数据包，那么IP将把它们向‘上’传送到TCP层。TCP将包排序并进行错误检查，同时实现虚电路间的连接。TCP数据包中包括序号和确认，所以未按照顺序收到的包可以被排序，而损坏的包可以被重传。

TCP将它的信息送到更高层的应用程序，例如Telnet的服务程序和客户程序。应用程序轮流将信息送回TCP层，TCP层便将它们向下传送到IP层，设备驱动程序和物理介质，最后到接收方。

TCP数据包和UDP数据包一样，都是内嵌在IP数据包的”数据”部分。TCP数据包没有长度限制，理论上可以无限长，但是为了保证网络的效率，通常TCP数据包的长度不会超过IP数据包的长度，以确保单个TCP数据包不必再分割。

五、应用层

应用程序间沟通的层。“应用层”的作用，就是规定应用程序的数据格式，对收到”传输层”的数据按规定的格式进行解读。

举例来说，TCP协议可以为各种各样的程序传递数据，比如Email、WWW、FTP等等。那么，必须有不同协议规定电子邮件、网页、FTP数据的格式，简单电子邮件传输（SMTP）、文件传输协议（File Transfer Protocol，FTP）、网络远程访问协议（Telnet）、超文本链接协议（Hyper Text Transfer Protocol，HTTP）等应用程序协议就构成了”应用层”。也有基于UDP协议的DNS:53,TFTP:69, SNMP:161, RIP:520（各个服务对应的端口）。

这是最高的一层，直接面对用户。它的数据就放在TCP数据包的”数据”部分。因此，现在的以太网的数据包就变成下面这样。

借鉴了这篇文章http://blog.csdn.net/jiqiandong/article/details/39393847(用了其中的图)，以上就是整个互联网的五层结构。