一、网络相关
1.1 网络通信概述
- 网络就是一种辅助双方或者多方能够连接在一起的工具
- 使用网络能够把多方链接在一起,然后可以进行数据传递
- 所谓的网络编程就是,让在不同的电脑上的软件能够进行数据传递,即进程之间的通信
1.2 IP地址
(1)ip地址:用来在网络中标记一台电脑,比如192.168.1.1,在本地局域网上是唯一的
(2)ip地址的分类:
每一个IP地址包括两部分:网络地址和主机地址
A类IP地址
一个A类IP地址由1字节的网络地址和3字节主机地址组成,网络地址的最高位必须是“0”,
地址范围1.0.0.1-126.255.255.254
二进制表示为:00000001 00000000 00000000 00000001 - 01111110 11111111 11111111 11111110
可用的A类网络有126个,每个网络能容纳1677214个主机
B类IP地址
一个B类IP地址由2个字节的网络地址和2个字节的主机地址组成,网络地址的最高位必须是“10”,
地址范围128.1.0.1-191.255.255.254
二进制表示为:10000000 00000001 00000000 00000001 - 10111111 11111111 11111111 11111110
可用的B类网络有16384个,每个网络能容纳65534主机
C类IP地址
一个C类IP地址由3字节的网络地址和1字节的主机地址组成,网络地址的最高位必须是“110”
范围192.0.1.1-223.255.255.254
二进制表示为: 11000000 00000000 00000001 00000001 - 11011111 11111111 11111110 11111110
C类网络可达2097152个,每个网络能容纳254个主机
D类IP地址
用于多点广播
D类IP地址第一个字节以“1110”开始,它是一个专门保留的地址。
它并不指向特定的网络,目前这一类地址被用在多点广播(Multicast)中
多点广播地址用来一次寻址一组计算机 s 地址范围224.0.0.1-239.255.255.254
E类IP地址
以“1111”开始,为将来使用保留
E类地址保留,仅作实验和开发用
私有ip
在这么多网络IP中,国际规定有一部分IP地址是用于我们的局域网使用,也就
是属于私网IP,不在公网中使用的,它们的范围是:
10.0.0.0~10.255.255.255
172.16.0.0~172.31.255.255
192.168.0.0~192.168.255.255
IP地址127.0.0.1~127.255.255.255用于回路测试,
1.3 Linux中与网络配置相关的命令
-ping <IP_addr> 检测IP的网络连接
-ifconfig 显示网卡信息
1.4 端口
(1)什么是端口
端口就好一个房子的门,是出入这间房子的必经之路。
如果一个程序需要收发网络数据,那么就需要有这样的端口
在linux系统中,端口可以有65536(2的16次方)个之多!
既然有这么多,操作系统为了统一管理,所以进行了编号,这就是端口号
(2)端口号
端口是通过端口号来标记的,端口号只有整数,范围是从0到65535
注意:端口数不一样的*nix系统不一样,还可以手动修改
(3)端口是怎样分配的
端口号不是随意使用的,而是按照一定的规定进行分配。
端口的分类标准有好几种,我们这里不做详细讲解,只介绍一下知名端口和动态端口
知名端口(Well Known Ports):知名端口是众所周知的端口号,范围从0到1023
80端口分配给HTTP服务
21端口分配给FTP服务
可以理解为,一些常用的功能使用的号码是固定的。一般情况下,如果一个程序需要使用知名端口的需要有root权限
动态端口(Dynamic Ports):范围是从1024到65535
之所以称为动态端口,是因为它一般不固定分配某种服务,而是动态分配。
动态分配是指当一个系统程序或应用程序程序需要网络通信时,它向主机申请一个端口,主机从可用的端口号中分配一个供它使用。
当这个程序关闭时,同时也就释放了所占用的端口号
(4)查看端口
- 用“netstat -an”查看端口状态
二、UDP协议:数据报套接字
2.1 socket
在1台电脑上可以通过进程号(PID)来唯一标识一个进程,但是在网络中这是行不通的。
TCP/IP协议族已经帮我们解决了这个问题,网络层的“ip地址”可以唯一标识网络中的主机,而传输层的“协议+端口”可以唯一标识主机中的应用进程(进程)
这样利用ip地址,协议,端口就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互
注意:
- 所谓
进程
指的是:运行的程序以及运行时用到的资源这个整体称之为进程- 所谓
进程间通信
指的是:运行的程序之间的数据共享
什么是socket
socket (简称 套接字
) 是进程间通信的一种方式,它与其他进程间通信的一个主要不同是:
它能实现不同主机间的进程间通信,我们网络上各种各样的服务大多都是基于 Socket 来完成通信的
例如我们每天浏览网页、QQ 聊天、收发 email 等等
在 Python 中 使用socket 模块的函数 socket 就可以完成:
import socket
socket.socket(AddressFamily, Type)
说明:
函数 socket.socket 创建一个 socket,该函数带有两个参数:
- Address Family:可以选择 AF_INET(用于 Internet 进程间通信) 或者 AF_UNIX(用于同一台机器进程间通信),实际工作中常用AF_INET
- Type:套接字类型,可以是 SOCK_STREAM(流式套接字,主要用于 TCP 协议)或者 SOCK_DGRAM(数据报套接字,主要用于 UDP 协议)
例如:创建一个tcp_socket(tcp套接字)
import socket
# 创建tcp的套接字
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# ...这里是使用套接字的功能(省略)...
# 不用的时候,关闭套接字
s.close()
抑或是:创建一个udp_socket(udp套接字)
import socket
# 创建udp的套接字
s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
# ...这里是使用套接字的功能(省略)...
# 不用的时候,关闭套接字
s.close()
套接字使用流程 与 文件 的使用流程很类似:
- 创建套接字
- 使用套接字收/发数据
- 关闭套接字
# coding=utf-8
from socket import *
# udp网络程序 - 发送、接受数据
# 创建一个基于udp的网络程序流程:
# 1.创建客户端套接字
udp_socket = socket(AF_INET, SOCK_DGRAM)
# 2.准备接收方的地址
# 目标地址:192.168.1.103
# 端口:8080
# 使用元组类型来记录地址和端口信息 - ip地址是字符串,端口是数字
dest_addr = ('192.168.1.104', 8080)
# 3.从键盘获取数据
send_data = input("输入要发送的数据:")
# 4.发送数据到指定电脑上的指定程序中
udp_socket.sendto(send_data.encode('utf-8'), dest_addr)
# 5.关闭socket
udp_socket.close()
2.2 udp网络程序(发送、接收数据)
udp模型流程:
# encoding=utf-8
from socket import *
udp_socket = socket(AF_INET, SOCK_DGRAM)
# 绑定本地数据
local_addr = ("", 8080)
udp_socket.bind(local_addr)
# 等待接收对方的发送数据
recv_data = udp_socket.recvfrom(1024)
# 接收到的数据是一个元组,第一个元素是对方发送的数据,第二个元素是对方的ip地址和端口
print(recv_data[0].decode('gbk'))
print(recv_data[1])
dest_addr = ('192.168.0.104', 8081)
send_data = input("输入要传输的内容:")
udp_socket.sendto(send_data.encode('utf-8'), dest_addr)
# 等待接收对方的发送数据
recv_data = udp_socket.recvfrom(1024)
# 接收到的数据是一个元组,第一个元素是对方发送的数据,第二个元素是对方的ip地址和端口
print(recv_data[0].decode('gbk'))
print(recv_data[1])
udp_socket.close()
上面的代码是使用udp发送接收数据的具体实现:可以看到能够从linux系统和windows系统之间进行消息互传
2.3 编码转换
字符串通过 编码(encode) 成为字节码,字节码通过 解码(decode) 成为字符串
str->bytes:encode编码
bytes->str:decode解码
>>> text = '我是文本'
>>> text
'我是文本'
>>> print(text)
我是文本
>>> bytesText = text.encode()
>>> bytesText
b'\xe6\x88\x91\xe6\x98\xaf\xe6\x96\x87\xe6\x9c\xac'
>>> print(bytesText)
b'\xe6\x88\x91\xe6\x98\xaf\xe6\x96\x87\xe6\x9c\xac'
>>> type(text)
<class 'str'>
>>> type(bytesText)
<class 'bytes'>
>>> textDecode = bytesText.decode()
>>> textDecode
'我是文本'
>>> print(textDecode)
我是文本
其中decode()与encode()方法可以接受参数,其声明分别为:
bytes.decode(encoding="utf-8", errors="strict")
str.encode(encoding="utf-8", errors="strict")
2.4 udp绑定信息
如果不绑定程序的使用端口,在进行发送的时候就会获得系统的一个随机分配的端口,这样不利于维护和另一方回复数据
因此在创建了套接字socket之后需要使用bind方法来设置程序的固定端口
例如:
#coding=utf-8
from socket import *
# 1. 创建套接字
udp_socket = socket(AF_INET, SOCK_DGRAM)
# 2. 绑定本地的相关信息,如果一个网络程序不绑定,则系统会随机分配
local_addr = ('', 7788) # ip地址和端口号,ip一般不用写,表示本机的任何一个ip
udp_socket.bind(local_addr)
# 3. 等待接收对方发送的数据
recv_data = udp_socket.recvfrom(1024) # 1024表示本次接收的最大字节数
# 4. 显示接收到的数据
print(recv_data[0].decode('gbk'))
# 5. 关闭套接字
udp_socket.close()
这样在接收端就能看到每次运行的消息来源都是同一个端口7788
注意bind( )的参数是一个元组类型("IP", int (port) )