UDP提供的是不可靠的数据传输服务。流控机制是区分UDP和TCP的最重要的标志。
UDP 内部工作原理
与TCP不同, UDP不会进行流控制。接下来具体讨论UDP的作用, 如图所示。
IP的作用就是让离开主机B 的UDP数据包准确传递到主机A 。但把UDP包最终交给主机A的某-UDP套接字的过程则是由UDP完成的。UDP最重要的作用就是根据端口号将传到主机的数据包交付给最终的UDP套接字。
UDP 中的服务器端和客户端没有连接
UDP服务器端/客户端不像TCP那样在连接状态下交换数据,因此与TCP不同,无需经过连接过程。也就是说,不必调用TCP连接过程中调用的listen 函数和accept函数。UDP中只有创建套接字的过程和数据交换过程。
UDP 服务器端和客户端均只需1个套接字
注意:
TCP的 listen 相当于一个门卫,只是处理连接请求的受理顺序,而 accept 用来正真的处理数据传输,accept会自动生成一个套接字。
因此:TCP 中的套接字之间应该是一对一的关系。若要向10个客户端提供服务,则除了守门的服务器套接字外,还需要10个服务器端套接字,也就是服务器要 11 个套接字。
UDP 中,不管是服务器端还是客户端都只需要1个套接字。之前解释UDP原理时举了信件的例子,收发信件时使用的邮筒可以比喻为UDP套接字。只要附近有1 个邮筒,就可以通过它向任意地址寄出信件。同样,只需1 个UDP套接字就可以向任主机传输数据,如图所示。
也就是TCP是多对多,UDP是一对多。
基千UDP 的数据I/O函数——————————————————————
创建好TCP套接字后,传输数据时无需再添加地址信息。因为TCP套接字将保持与对方套接字的连接。换言之, TCP套接字知道目标地址信息。但UDP套接字不会保持连接状态(UDP套接字只有简单的邮筒功能),因此每次传输数据都要添加目标地址信息。这相当于寄信前在信件中填写地址。接下来介绍填写地址并传输数据时调用的UDP相关函数。
发送函数:
#include <sys/socket.h>
ssize_t sendto(int sock, void *buff, size_t nbytes, int flags, struct sockaddr *to, socklen_t addrlen);
//成功时返回传输的字节数,失败时返回-1 。
#sock 用于传输数据的UDP套接字文件描述符。
#buff 保存待传输数据的缓冲地址值。
#nbytes 待传输的数据长度,以字节为单位。
#flags 可选项参数,若没有则传递0。
#to 存有目标地址信息的sockaddr结构体变量的地址值。
#addrlen 传递给参数to的地址值结构体变量长度。
接收函数:
#include <sys/socket.h>
ssize_t recvfrom(int sock, void *buff, size_t nbytes, int flags, struct sockaddr * from, socklen_t *addrlen);
成功时返回接收的字节数,失败时返回-1。
#sock 用于接收数据的UDP套接字文件描述符。
#buff 保存接收数据的缓冲地址值。
#nbytes 可接收的最大字节数,故无法超过参数butt所指的缓冲大小。
#flags 可选项参数,若没有则传入0 。
#from 存有发送端地址信息的sockadd结构体体变量的地址值。
#addrlen 保存参数from的结构体变量长度的变量地址值。
需要注意的是, UDP不同于TCP , 不存在请求连接和受理过程,因此在某种意义上无法明确区分服务器端和客户端。只是因其提供服务而称为服务器端。
示例程序:——————————————————————————————————
- 服务器端在同一时刻只与一个客户端相连,并提供回声服务。
- 服务器端一直客户端提供服务。
- 客户端接收用户输入的字符串并发送到服务器端。
- 服务器端将接收的字符串数据传回客户端, 即“回声” 。
- 服务器端与客户端之间的字符串回声一直执行到客户端输入Q为止。
服务器:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
void error_handling(char *message);
int main(int argc, char *argv[])
{
int serv_sock;
char message[BUF_SIZE];
int str_len;
socklen_t clnt_adr_sz;
struct sockaddr_in serv_adr, clnt_adr;
if(argc != 2){
printf("Usage : %s <port>\n", argv[0]);
exit(1);
}
serv_sock = socket(PF_INET, SOCK_DGRAM, 0) ;
if(serv_sock == -1)
error_handling("UDP socket cr eation error" ) ;
memset(&serv_adr, 0, sizeof(serv_adr ));
serv_adr.sin_family=AF_INET;
serv_adr.sin_addr.s_addr=htonl(INADDR_ANY);
serv_adr.sin_port = htons(atoi(argv[1]));
if(bind(serv_sock, (struct sockaddr*)&serv_adr, sizeof(serv_adr)) == -1)
error_handling("bind() error");//建立绑定信息
memset(message, 0, sizeof(message));
while(1)
{
clnt_adr_sz = sizeof(clnt_adr) ;
str_len = recvfrom(serv_sock, message, BUF_SIZE, 0, (struct sockaddr*)&clnt_adr, &clnt_adr_sz);
sendto(serv_sock, message, str_len, 0, (struct sockaddr* )&clnt_adr, clnt_adr_sz);
memset(message, 0, sizeof(message));
}
close(serv_sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
客户端:
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>
#define BUF_SIZE 1024
void error_handling(char *message);
int main(int argc, char* argv[])
{
int sock;
char message[BUF_SIZE];
int str_len;
socklen_t adr_sz;
struct sockaddr_in serv_adr, from_adr;
if(argc!=3){
printf("Usage : %s <IP> <port>\n", argv[0]);
exit(1);
}
sock=socket(PF_INET, SOCK_DGRAM, 0);
if(sock==-1)
error_handling("socket() error");
memset(&serv_adr, 0, sizeof(serv_adr));
serv_adr.sin_family=AF_INET;
serv_adr.sin_addr.s_addr=inet_addr(argv[1]);
serv_adr.sin_port=htons(atoi(argv[2]));
while(1)
{
fputs("Insert message(q to quit): ", stdout);
fgets(message, sizeof(message), stdin);
if(!strcmp(message, "q\n") || !strcmp(message, "Q\n"))
break;
sendto(sock, message, strlen(message), 0, (struct sockaddr*)&serv_adr, sizeof(serv_adr));
adr_sz = sizeof(from_adr);
memset(message, 0, sizeof(message));
str_len = recvfrom(sock, message, BUF_SIZE, 0, (struct sockaddr*)&from_adr, &adr_sz);
message[str_len]=0;
printf("Message from server: %s", message);
memset(message, 0, sizeof(message));
}
close(sock);
return 0;
}
void error_handling(char *message)
{
fputs(message, stderr);
fputc('\n', stderr);
exit(1);
}
TCP客户端调用connect函数自动完成此过程。
UDP调用sendto 函数时发现尚未分配地址信息, 则在首次调用sendto函数时给相应套接字自动分配IP和端口。而且此时分配的地址一直保留到程序结束为止, 因此也可用来与其他UDP套接字进行数据交换。当然, IP用主机IP , 端口号选尚未使用的任意端口号。
边界问题————————————————————————
TCP 套接字中的I/O缓冲
TCP套接字的数据收发无边界。服务器端即使调用1次write函数传输40字节的数据,客户端也有可能通过4次read函数调用每次读取10字节。但此处也有一些疑问,服务器端一次性传输了40字节,而客户端居然可以缓慢地分批接收。客户端接收10字节后,剩下的30字节在何处等候呢?是不是像飞机为等待着陆而在空中盘旋一样,剩下30字节也在网络中徘徊并等待接收呢?
实际上, write函数调用后并非立即传输数据, read函数调用后也并非马上接收数据。更准确地说,如图所示, write函数调用瞬间,数据将移至输出缓冲; read函数调用瞬间,从输入缓冲读取数据。
这表示“ TCP 数据传给过程中调用I/O函数的次数不具有任何意义。”
存在数据边界的 UDP 套接字
UDP是具有数据边界的协议,传输中调用I/0 函数的次数非常重要。因此,输入函数的调用次数应和输出函数的调用次数完全一致,这样才能保证接收全部已发送数据。
UDP 数据报(Datagram)
UDP 套接字传输的数据包又称数据报,实际上数据报也属于数据包的一种。只是与TCP 包不同,其本身可以成为1 个完整数据。这与UDP 的数据传输特性有关, UDP 中存在数据边界, 1 个数据包即可成为1 个完整数据,因此称为数据报。
已连接( connected ) UDP 套接字与未连接( unconnected ) UDP 套接字
客户端通过 sendto 函数传输数据的过程大致可分为以下3个阶段。
- 第1 阶段:向UDP套接字注册目标IP和端口号。
- 第2 阶段:传输数据。
- 第3 阶段:删除UDP套接字中注册的目标地址信息。
因此每一次调用 sendto 函数就要建立一个套接字,很浪费时间。
而TCP只在调用connet函数时建立一次套接字,然后就可以一直发送数据。
创建已连接UDP 套接字
创建已连接UDP套接字的过程格外简单, 只需针对UDP套接字调用connect函数。
sock = socket(PF_INET, SOCK_DGRAM, 0);
memset(&adr, 0, sizeof(adr));
adr.sin_family = AF_INET;
adr.sin_addr.s_addr = 1.1.1.1;
adr.sin_port = 6666;
connect (sock, (struct sockaddr * ) &adr, sizeof(adr));
上述代码看似与TCP套接字创建过程一致,但socket 函数的第二个参数分明是SOCK_OGRAM 。也就是说,创建的的确是UDP套接字。当然,针对UDP套接字调用connect函数并不意味着要与对方UDP套接字连接,这只是向UDP套接字注册目标IP和端口信息。
之后就与TCP套接字一样,每次调用sendto函数时只需传输数据。因为已经指定了收发对象,所以不仅可以使用sendto 、recvfrom函数,还可以使用write 、read函数进行通信。
所以下面的代码可以改变:
sendto(sock, message, strlen(message), 0, (struct sockaddr*)&serv_adr, sizeof(serv_adr));//发送
str_len = recvfrom(sock, message, BUF_SIZE, 0, (struct sockaddr*)&from_adr, &adr_sz);//接收
为:
connect(sock, (struct sockaddr*)&serv_adr, sizeof(serv_adr));//连接
write(sock, message, strlen(message));//发送
str_len=read(sock, message, sizeof(message)-1);//接收