网络传输UDP与TCP模型（一）

一、网络相关

1.1 网络通信概述

网络就是一种辅助双方或者多方能够连接在一起的工具
使用网络能够把多方链接在一起，然后可以进行数据传递
所谓的网络编程就是，让在不同的电脑上的软件能够进行数据传递，即进程之间的通信

1.2 IP地址

（1）ip地址：用来在网络中标记一台电脑，比如192.168.1.1，在本地局域网上是唯一的

（2）ip地址的分类：

每一个IP地址包括两部分：网络地址和主机地址

A类IP地址

一个A类IP地址由1字节的网络地址和3字节主机地址组成，网络地址的最高位必须是“0”，

地址范围1.0.0.1-126.255.255.254

二进制表示为：00000001 00000000 00000000 00000001 - 01111110 11111111 11111111 11111110

可用的A类网络有126个，每个网络能容纳1677214个主机

B类IP地址

一个B类IP地址由2个字节的网络地址和2个字节的主机地址组成，网络地址的最高位必须是“10”，

地址范围128.1.0.1-191.255.255.254

二进制表示为：10000000 00000001 00000000 00000001 - 10111111 11111111 11111111 11111110

可用的B类网络有16384个，每个网络能容纳65534主机

C类IP地址

一个C类IP地址由3字节的网络地址和1字节的主机地址组成，网络地址的最高位必须是“110”

范围192.0.1.1-223.255.255.254

二进制表示为: 11000000 00000000 00000001 00000001 - 11011111 11111111 11111110 11111110

C类网络可达2097152个，每个网络能容纳254个主机

D类IP地址

用于多点广播

D类IP地址第一个字节以“1110”开始，它是一个专门保留的地址。

它并不指向特定的网络，目前这一类地址被用在多点广播（Multicast）中

多点广播地址用来一次寻址一组计算机 s 地址范围224.0.0.1-239.255.255.254

E类IP地址

以“1111”开始，为将来使用保留

E类地址保留，仅作实验和开发用

私有ip

在这么多网络IP中，国际规定有一部分IP地址是用于我们的局域网使用，也就

是属于私网IP，不在公网中使用的，它们的范围是：

10.0.0.0～10.255.255.255

172.16.0.0～172.31.255.255

192.168.0.0～192.168.255.255

IP地址127．0．0．1~127．255．255．255用于回路测试，

1.3 Linux中与网络配置相关的命令

-ping <IP_addr> 检测IP的网络连接

-ifconfig 显示网卡信息

1.4 端口

（1）什么是端口

端口就好一个房子的门，是出入这间房子的必经之路。

如果一个程序需要收发网络数据，那么就需要有这样的端口

在linux系统中，端口可以有65536（2的16次方）个之多！

既然有这么多，操作系统为了统一管理，所以进行了编号，这就是端口号

（2）端口号

端口是通过端口号来标记的，端口号只有整数，范围是从0到65535

注意：端口数不一样的*nix系统不一样，还可以手动修改

（3）端口是怎样分配的

端口号不是随意使用的，而是按照一定的规定进行分配。

端口的分类标准有好几种，我们这里不做详细讲解，只介绍一下知名端口和动态端口

知名端口（Well Known Ports）：知名端口是众所周知的端口号，范围从0到1023

80端口分配给HTTP服务
21端口分配给FTP服务

可以理解为，一些常用的功能使用的号码是固定的。一般情况下，如果一个程序需要使用知名端口的需要有root权限

动态端口（Dynamic Ports）：范围是从1024到65535

之所以称为动态端口，是因为它一般不固定分配某种服务，而是动态分配。

动态分配是指当一个系统程序或应用程序程序需要网络通信时，它向主机申请一个端口，主机从可用的端口号中分配一个供它使用。

当这个程序关闭时，同时也就释放了所占用的端口号

（4）查看端口

用“netstat －an”查看端口状态

二、UDP协议：数据报套接字

2.1 socket

在1台电脑上可以通过进程号（PID）来唯一标识一个进程，但是在网络中这是行不通的。

TCP/IP协议族已经帮我们解决了这个问题，网络层的“ip地址”可以唯一标识网络中的主机，而传输层的“协议+端口”可以唯一标识主机中的应用进程（进程）

这样利用ip地址，协议，端口就可以标识网络的进程了，网络中的进程通信就可以利用这个标志与其它进程进行交互

注意：

所谓进程指的是：运行的程序以及运行时用到的资源这个整体称之为进程

所谓进程间通信指的是：运行的程序之间的数据共享

什么是socket

socket (简称 套接字) 是进程间通信的一种方式，它与其他进程间通信的一个主要不同是：

它能实现不同主机间的进程间通信，我们网络上各种各样的服务大多都是基于 Socket 来完成通信的

例如我们每天浏览网页、QQ 聊天、收发 email 等等

在 Python 中使用socket 模块的函数 socket 就可以完成：

import socket
socket.socket(AddressFamily, Type)

说明：

函数 socket.socket 创建一个 socket，该函数带有两个参数：

Address Family：可以选择 AF_INET（用于 Internet 进程间通信）或者 AF_UNIX（用于同一台机器进程间通信）,实际工作中常用AF_INET
Type：套接字类型，可以是 SOCK_STREAM（流式套接字，主要用于 TCP 协议）或者 SOCK_DGRAM（数据报套接字，主要用于 UDP 协议）

例如：创建一个tcp_socket（tcp套接字）

import socket

# 创建tcp的套接字
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)

# ...这里是使用套接字的功能（省略）...

# 不用的时候，关闭套接字
s.close()

抑或是：创建一个udp_socket（udp套接字）

import socket

# 创建udp的套接字
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)

# ...这里是使用套接字的功能（省略）...

# 不用的时候，关闭套接字
s.close()

套接字使用流程与文件的使用流程很类似：

创建套接字
使用套接字收/发数据
关闭套接字

# coding=utf-8
from socket import *


# udp网络程序 - 发送、接受数据
# 创建一个基于udp的网络程序流程：

# 1.创建客户端套接字
udp_socket = socket(AF_INET, SOCK_DGRAM)

# 2.准备接收方的地址
# 目标地址：192.168.1.103
# 端口：8080
# 使用元组类型来记录地址和端口信息 - ip地址是字符串，端口是数字
dest_addr = ('192.168.1.104', 8080)

# 3.从键盘获取数据
send_data = input("输入要发送的数据：")

# 4.发送数据到指定电脑上的指定程序中
udp_socket.sendto(send_data.encode('utf-8'), dest_addr)

# 5.关闭socket
udp_socket.close()

2.2 udp网络程序（发送、接收数据）

udp模型流程：

# encoding=utf-8
from socket import *


udp_socket = socket(AF_INET, SOCK_DGRAM)

# 绑定本地数据
local_addr = ("", 8080)
udp_socket.bind(local_addr)
# 等待接收对方的发送数据
recv_data = udp_socket.recvfrom(1024)
# 接收到的数据是一个元组，第一个元素是对方发送的数据，第二个元素是对方的ip地址和端口
print(recv_data[0].decode('gbk'))
print(recv_data[1])

dest_addr = ('192.168.0.104', 8081)

send_data = input("输入要传输的内容：")

udp_socket.sendto(send_data.encode('utf-8'), dest_addr)

# 等待接收对方的发送数据
recv_data = udp_socket.recvfrom(1024)
# 接收到的数据是一个元组，第一个元素是对方发送的数据，第二个元素是对方的ip地址和端口
print(recv_data[0].decode('gbk'))
print(recv_data[1])

udp_socket.close()

上面的代码是使用udp发送接收数据的具体实现：可以看到能够从linux系统和windows系统之间进行消息互传

2.3 编码转换

字符串通过 编码(encode) 成为字节码，字节码通过 解码(decode) 成为字符串

str->bytes:encode编码
bytes->str:decode解码

>>> text = '我是文本'
>>> text
'我是文本'
>>> print(text)
我是文本
>>> bytesText = text.encode()
>>> bytesText
b'\xe6\x88\x91\xe6\x98\xaf\xe6\x96\x87\xe6\x9c\xac'
>>> print(bytesText)
b'\xe6\x88\x91\xe6\x98\xaf\xe6\x96\x87\xe6\x9c\xac'
>>> type(text)
<class 'str'>
>>> type(bytesText)
<class 'bytes'>
>>> textDecode = bytesText.decode()
>>> textDecode
'我是文本'
>>> print(textDecode)
我是文本

其中decode()与encode()方法可以接受参数，其声明分别为:

bytes.decode(encoding="utf-8", errors="strict")
str.encode(encoding="utf-8", errors="strict")

2.4 udp绑定信息

如果不绑定程序的使用端口，在进行发送的时候就会获得系统的一个随机分配的端口，这样不利于维护和另一方回复数据

因此在创建了套接字socket之后需要使用bind方法来设置程序的固定端口

例如：

#coding=utf-8

from socket import *

# 1. 创建套接字
udp_socket = socket(AF_INET, SOCK_DGRAM)

# 2. 绑定本地的相关信息，如果一个网络程序不绑定，则系统会随机分配
local_addr = ('', 7788) #  ip地址和端口号，ip一般不用写，表示本机的任何一个ip
udp_socket.bind(local_addr)

# 3. 等待接收对方发送的数据
recv_data = udp_socket.recvfrom(1024) #  1024表示本次接收的最大字节数

# 4. 显示接收到的数据
print(recv_data[0].decode('gbk'))

# 5. 关闭套接字
udp_socket.close()

这样在接收端就能看到每次运行的消息来源都是同一个端口7788

注意bind( )的参数是一个元组类型（"IP", int (port) ）