《Python学习之路 -- Python基础之网络通信原理》

  说网络通信原理之前必须先了解操作系统的概念,操作系统(Operating System,简称OS)是管理和控制计算机硬件和软件资源的计算机程序,是直接运行在裸机上的最基本的操作软件,任何其他软件都必须在操作系统的支持先才能运行。

  然而,一台计算机有了操作系统就能正常的工作了,但是还不能跟其他计算机进行交流。如果需要跟其他计算机进行通信,那么还得连接到 Internet 上,互联网的本质其实就是一堆网络协议,这些协议定义了计算机如何接入 Internet ,以及接入 Internet 的计算机通信的标准。

  互联网协议按照功能不同人为划分为七层(简称osi七层协议):应用层,表示层,会话层,传输层,网络层,数据链路层,物理层。物理层主要是基于电器特性发送高低电压(电信号),高电压对应数字1,低电压对应数字0;然而,单纯的电信号0和1是没有任何意义的,必须规定电信号多少位一组,每组是什么意思,所以就有了数据链路层的概念了,数据链路层规定了电信号的分组方式 —— 以太网协议(ethernet):

1、一组电信号构成一个数据包,称为‘帧’(数据帧)

2、每一个数据帧分成报头 head 和数据 data 两部分

 其中,head 包含:(固定18个字节)

①发送者 / 源地址 (6个字节)  mac地址

②接收着 / 目标地址  (6个字节)  mac地址

③数据类型  (6个字节)

data包含:(最短46字节,最长1500字节)

IP数据包、数据包的具体内容

IP数据包也分为head何data部分,head长度为20字节,data最长是65515字节

所以可以算出: head 长度 + data 长度 = 最短64字节,最长1518字节,如果超过最大限制则会分片发送。

  ethernet 规定接入 Internet 的设备都必须具备网卡,发送端和接收端的地址是网卡的地址,称为mac地址(每块网卡出厂时都会有一个唯一的标志,长度为48位2进制,通常由12位16进制数表示(前6位是厂商编号,后6位是流水号),例: 02:88:65:3e:a1:ec)。有了mac地址,同一网络内的两台主机就可以通信了,一台主机通过arp协议获取另外一台主机的mac地址。

  所有上层的包到最后都要封装上以太网头,然后通过以太网协议发送。通信是基于mac的广播方式实现的,计算机在发包时,先获取自身的mac地址,然后通过arp协议获取目标主机的mac地址,也就是说,arp协议的作用就是规定以广播的方式发送数据包,并获取目标主机的mac地址。有了ethernet、mac地址、广播的发送方式,世界上的计算机就可以彼此通信了,问题是世界范围的互联网是由一个个彼此隔离的小的局域网组成的,那么如果所有的通信都采用以太网广播的方式,那么一台计算机发送的包全世界都能收到,这会导致效率非常的低。世界大网络由一个个彼此相隔的局域网组成,以太网包只能在一个局域网内发送,一个局域网是一个广播域,以太网的广播只能在一个广播域内发送,跨广播域通信只能通过路由转发。说到这里,就必须得找出一种方法来区分那些计算机是属于同一个广播域的,如果是同一个广播域就采用广播的方式发送,如果不是,就采用路由的方式发送,这就要提到网络层了,网络层引入一套新的地址用来区分不同的广播域 / 子网,这就是我们熟悉的网络地址(IP地址)。

  规定网络地址的协议叫做 IP 协议,它定义的地址称为 IP 地址,广泛采用的版本为 IPV4,它规定网络地址由32位2进制表示,范围是:0.0.0.0-255.255.255.255,一个 IP 地址通常写成四段十进制数,例如:172.16.10.1 ;IP地址分为两部分:网络部分和主机部分,网络部分标识子网,主机部分标识主机,单纯的IP地址只是标识了IP地址的种类,从网络部分或者主机部分都无法辨识一个IP所处的子网。那么如何判断是否在同一个子网呢?这就需要提到子网掩码的概念呢了,所谓子网掩码,就是标识子网特征的一个参数。它在形式上等同于IP地址,也是一个32位二进制数字,它的网络部分全部为1,主机部分全部为0。比如,IP地址172.16.10.1,如果已知网络部分是前24位,主机部分是后8位,那么子网络掩码就是11111111.11111111.11111111.00000000,转化为10进制就是255.255.255.0 。知道了子网掩码就能判断任意两个IP地址是否处在同一个子网络。方法就是将两个IP地址与子网掩码分别进行AND运算(两个数位都为1,运算结果为1,否则为0),然后比较结果是否相同,如果是的话,就表明他们在同一子网络中,否则不是。总而言之,IP协议的作用就是两个:为每台计算机分配IP地址,确定哪些地址在同一个子网络。

  网络层的IP帮我们区分了子网,以太网层的mac帮我们找到了主机,然后大家使用的都是应用程序,比如qq,微信等,那么我们通过IP和mac找到一个特定的主机,如何标识这个主机上的应用程序呢?答案就是端口,端口就是应用程序与网卡关联的编号。那么,在通信的桥梁上还缺一块——端口与端口之间的通信,然而这个功能正是由传输层实现的。端口的范围是0-65535,其中0-1023是系统占用的端口。

  用户使用的都是应用程序,均工作于应用层,大家都可以开发自己的应用程序,然而数据也多种多样,必须规定好数据的组织方式,这就是应用层干的活了。TCP协议可以为各种各样的程序传递数据,比如e-mail、www、ftp等等。那么,必须有不同协议规定点子右键、网页、FTP数据的格式,这些应用程序协议就构成了应用层。

  补充:tcp协议是比较可靠的传输,TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,以确保一个TCP数据包不必再分割。

TCP数据包 = 以太网头 + IP头 + TCP头 + 数据

猜你喜欢

转载自www.cnblogs.com/jonas-von/p/9033962.html