TCP/IP网络编程之基于UDP的服务端/客户端

理解UDP

在之前学习TCP的过程中，我们还了解了TCP/IP协议栈。在四层TCP/IP模型中，传输层分为TCP和UDP这两种。数据交换过程可以分为通过TCP套接字完成的TCP方式和通过UDP套接字完成的UDP方式

UDP套接字的特点

下面通过信件讲解UDP的工作原理，寄信前应先在信封上填好寄信人和收信人的地址，之后贴上邮票放入邮筒即可。当然，信件的特点是我们无法确认对方能否收到，也会出现寄信过程中信件丢失的情况。也就是说，信件是一种不可靠的传输方式，与之类似，UDP提供的同样是不可靠的数据传输服务

如果按照我们上面所说，TCP比UDP好，为什么还要有UDP的存在呢？如果只考虑可靠性，TCP确实优胜于UDP。但UDP在结构上比TCP更简洁。UDP不会发送类似ACK的应答消息，也不会像SEQ那样给数据包分配序号。因此，UDP的性能比TCP高出许多。编程中UDP也比TCP简单。另外，UDP的可靠性虽然比不上TCP，但也不会像想象中那么频繁地发生数据损毁。因此，在更重视性能而非可靠性的情况下，UDP是一种很好的选择

既然如此，UDP的作用到底是什么呢？为了提供可靠的数据传输服务，TCP在不可靠的IP层进行流控制，而UDP就缺少这种流控制机制。所以，流控制是区分UDP和TCP的重要标志，若从TCP中取出流控制，所剩的内容也屈指可数了。也就是说TCP的可靠性在于流控制，之前说过TCP中“与对方套接字连接及断开连接的过程”也属于流控制的一部分

UDP内部工作原理

与TCP不同，UDP不会进行流控制。接下来具体讨论UDP的作用，如图1-1

图1-1 数据包传输中UDP和IP的作用

从图1-1可以看出，IP的作用就是让离开主机B的UDP数据包准备传递到主机A。但把UDP包最终交给主机A的某一UDP套接字的过程是由UDP完成的，UDP最重要的作用就是根据端口号将传到主机的数据包交付给最终的UDP套接字

UDP的高效实用

虽然大部分网络编程都是基于TCP实现的，但也有一些是用UDP实现的。接下来考虑何时实用UDP更有效，其实UDP也具有一定的可靠性，但是网络传输特性导致信息丢失频发，比如传递压缩文件要发送一万个数据包，只要丢失一个这个压缩文件都无法解压。但通过网络实时传输视频或音频时情况就不同了。对于多媒体数据而言，丢失一部分也没太大问题，只会引起短暂的画面抖动或出现细微的杂音。但因为需要提供实时服务，速度就成为至关重要的因素。因此，TCP的流控制就显得有点多余，此时需要考虑的是UDP。但UDP并非每次都快于TCP，TCP比UDP慢的原因通常有以下两点：

收发数据前后进行的连接设置及清除过程
收发数据过程中为保证可靠性而添加的流控制

如果收发的数据量小但需要频繁连接时，UDP比TCP更高效

实现基于UDP的服务端/客户端

UDP服务端/客户端不像TCP那样在连接状态下交换数据，因此与TCP不同，无需经过连接过程。也就是说，不必像TCP连接过程中调用listen和accept函数。UDP中只有创建套接字过程和数据交换过程。TCP中，套接字之间应该是一对一的关系。若要向十个客户端提供服务，则除了服务端套接字外，还需要十个用于与客户端连接的套接字，也就是由accept所产生的套接字。但在UDP中，不管是服务器端还是客户端都只需要一个套接字。之前解释UDP原理时举了信件的例子，收发信件时使用的邮筒可以比喻为UDP套接字。只要附近有一个邮筒，就可以通过它向任意地址寄出信件。同样，只需一个UDP套接字就可以向任何主机传输数据

图1-2 UDP套接字通信模型

图1-2展示了一个UDP套接字与两个不同主机交换数据的过程，也就是说，只需一个UDP套接字就能和多台主机通信

基于UDP的数据I/O函数

创建好TCP套接字后，传输数据时无需再添加地址信息，因为TCP套接字将保持与对方套接字的连接。换言之，TCP套接字知道目标地址信息。但UDP套接字不会保持连接状态（UDP套接字只有简单的邮筒功能），因此每次传输数据都要添加目标地址信息。这相当于寄信前在信件中填写地址，接下来介绍填写地址并传输数据时调用的UDP相关函数

#include <sys/socket.h> 
ssize_t sendto(int sock, const void *buff, size_t nbytes, int flags, const struct sockaddr *to, socklen_t addrlen);//成功时返回传输的字节数，失败时返回-1

sock：用于传输数据的UDP套接字文件描述符
buff：保存待传输数据的缓冲地址值
nbytes：待传输的数据长度，以字节为单位
flags：可选项参数，若没有则传递0
to：存有目标地址信息的sockaddr结构体变量的地址值
addrlen：传递给参数to的地址值结构体变量长度

上述函数与之前的TCP输出函数最大的区别在于，此函数需要向它传递目标地址信息。接下来介绍接收UDP数据的函数，UDP数据的发送端并不固定，因此该函数定义为可接收发送端信息的形式，也就是将同时返回UDP数据包的发送端信息

#include <sys/socket.h> 
ssize_t recvfrom (int sock, void *buff, size_t nbytes, int flags, struct sockaddr * from, socklen_t * addrlen);//成功时返回接收的字节数，失败时返回-1

sock：用于接收数据的UDP套接字文件描述符
buff：保存接收数据的缓冲地址值
nbytes：可接收的最大字节数，故无法超过参数buff所指的缓冲大小
flags：可选项参数，若没有则传递0
from：存有发送端地址信息的sockaddr结构体变量的地址值
addrlen：保存参数from的结构体变量长度的变量地址值

编写UDP程序时最核心的部分就在于上述两个函数，也说明二者在UDP数据传输中的地位

基于UDP的回声服务端/客户端

下面结合之前的内容实现回声服务器，需要注意的是，UDP不同于TCP，不存在请求连接和受理过程，因此在某种意义上无法明确区分服务端和客户端，只是因为提供服务而成为服务端

uecho_server.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

#define BUF_SIZE 30
void error_handling(char *message);

int main(int argc, char *argv[])
{
    int serv_sock;
    char message[BUF_SIZE];
    int str_len;
    socklen_t clnt_adr_sz;
    struct sockaddr_in serv_adr, clnt_adr;
    if (argc != 2)
    {
        printf("Usage:%s<port>\n", argv[0]);
        exit(1);
    }
    serv_sock = socket(PF_INET, SOCK_DGRAM, 0);
    if (serv_sock == -1)
        error_handling("UDP socket creation error");
    memset(&serv_adr, 0, sizeof(serv_adr));
    serv_adr.sin_family = AF_INET;
    serv_adr.sin_addr.s_addr = htonl(INADDR_ANY);
    serv_adr.sin_port = htons(atoi(argv[1]));
    if (bind(serv_sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr)) == -1)
        error_handling("bind() error");
    while (1)
    {
        clnt_adr_sz = sizeof(clnt_adr);
        str_len = recvfrom(serv_sock, message, BUF_SIZE, 0, (struct sockaddr *)&clnt_adr, &clnt_adr_sz); 
        sendto(serv_sock, message, str_len, 0, (struct sockaddr *)&clnt_adr, clnt_adr_sz);               
    }
    close(serv_sock); 
    return 0;
}
void error_handling(char *message)
{
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

第23行：为了创建UDP套接字，向socket函数第二个参数传递SOCK_DGRAM
第35行：利用30行分配的地址接收数据，不限制数据传输对象
第36行：通过第39行的函数调用同时获取数据传输端的地址，正是利用该地址将接收的数据逆向重传
第38行：第33行的while内部从未假如break语句，因此是无限循环，也就是说，close函数不会执行，没有太大的意义

接下来介绍与上述服务端协同工作的客户端，这部分代码与TCP不同，不存在connect函数调用

uecho_client.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

#define BUF_SIZE 30
void error_handling(char *message);

int main(int argc, char *argv[])
{
    int sock;
    char message[BUF_SIZE];
    int str_len;
    socklen_t adr_sz;
    struct sockaddr_in serv_adr, from_adr;
    if (argc != 3)
    {
        printf("Usage:%s<port>\n", argv[0]);
        exit(1);
    }
    sock = socket(PF_INET, SOCK_DGRAM, 0);
    if (sock == -1)
        error_handling("socket() error");
    memset(&serv_adr, 0, sizeof(serv_adr));
    serv_adr.sin_family = AF_INET;
    serv_adr.sin_addr.s_addr = inet_addr(argv[1]);
    serv_adr.sin_port = htons(atoi(argv[2]));
    while (1)
    {
        fputs("Insert message(q to quit):", stdout);
        fgets(message, sizeof(message), stdin);
        if (!strcmp(message, "q\n") || !strcmp(message, "Q\n"))
            break;
        sendto(sock, message, strlen(message), 0, (struct sockaddr *)&serv_adr, sizeof(serv_adr));
        adr_sz = sizeof(from_adr);
        str_len = recvfrom(sock, message, BUF_SIZE, 0, (struct sockaddr *)&from_adr, &adr_sz);
        message[str_len] = 0;
        printf("Message from server:%s", message);
    }
    close(sock);
    return 0;
}
void error_handling(char *message)
{
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

第23行：创建UDP套接字，现在只需调用数据收发函数
第36、38行：第36行向服务端传输数据，第38行接收数据

之前我们讲过TCP客户端套接字在调用connect函数时自动分配IP地址和端口号，既然如此，UDP客户端何时分配IP地址和端口号？所有套接字都应分配IP地址和端口号，问题是直接分配还是自动分配？现在我们先把这个问题按下，给出上面程序的运行结果再来讨论

编译uecho_server.c并运行

# gcc uecho_server.c -o uecho_server
# ./uecho_server 8500

编译uecho_client.c并运行

# gcc uecho_client.c -o uecho_client
# ./uecho_client 127.0.0.1 8500
Insert message(q to quit):Hello world!
Message from server:Hello world!
Insert message(q to quit):Java
Message from server:Java
Insert message(q to quit):Python
Message from server:Python
Insert message(q to quit):q

运行过程中的顺序不重要，只需保证调用sendto函数前，sendto函数的目标主机程序已经开始运行

UDP客户端套接字的地址分配

前面讲解了UDP服务端/客户端的实现方法，但如果仔细观察UDP客户端会发现，它缺少把IP端口分配给套接字的过程，TCP客户端调用connect函数自动完成此过程，而UDP连能承担相同功能的函数调用语句都没有，究竟是在何时分配IP地址和端口号呢？

UDP程序中，调用sendto函数传输数据前完成对套接字的地址分配工作，因此调用bind函数。当然，bind函数在TCP程序中出现过，但bind函数不区分TCP和UDP。另外调用sendto函数时尚未分配地址信息，则在首次调用sendto函数时给相应套接字自动分配IP地址和端口。而且此时分配的地址一直保留到程序结束为止。因此也可用来与其他UDP套接字进行数据交换，当然IP用主机IP，端口号选尚未使用的任意端口号

综上所述，调用sendto函数时自动分配IP和端口号，因此UDP客户端中通常无需额外的地址分配过程

UDP的数据传输特性和调用connect函数

我们之前通过示例验证TCP传输的数据不存在数据边界，本节将验证UDP数据传输中存在数据边界。最后讨论UDP中connect函数的调用，前面说过，TCP数据传输中不存在边界，这表名数据传输过程中调用I/O函数的次数不具有任何意义。相反，UDP是具有数据边界协议的，传输中调用I/O函数的次数非常重要。因此，输入函数的调用次数应和输出函数的调用次数完全一致，这样才能保证接收全部已发送的数据。下面通过简单的示例来验证：

bound_host1.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

#define BUF_SIZE 30
void error_handling(char *message);

int main(int argc, char *argv[])
{
    int sock;
    char message[BUF_SIZE];
    struct sockaddr_in my_adr, your_adr;
    socklen_t adr_sz;
    int str_len, i;
    if (argc != 2)
    {
        printf("Usage:%s<port>\n", argv[0]);
        exit(1);
    }
    sock = socket(PF_INET, SOCK_DGRAM, 0);
    if (sock == -1)
        error_handling("socket() error");
    memset(&my_adr, 0, sizeof(my_adr));
    my_adr.sin_family = AF_INET;
    my_adr.sin_addr.s_addr = htonl(INADDR_ANY);
    my_adr.sin_port = htons(atoi(argv[1]));
    if (bind(sock, (struct sockaddr *)&my_adr, sizeof(my_adr)) == -1)
        error_handling("bind()error");
    for (i = 0; i < 3; i++)
    {
        sleep(5); //delay 5 sec
        adr_sz = sizeof(your_adr);
        str_len = recvfrom(sock, message, BUF_SIZE, 0, (struct sockaddr *)&your_adr, &adr_sz);
        printf("Message %d:%s\n", i + 1, message);
    }
    close(sock);
    return 0;
}
void error_handling(char *message)
{
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

上述示例中需要特别留意第32行中的for语句，首先在第34行调用sleep函数，使程序停顿时间等于传递来的时间（以秒为单位）参数。也就是说，第32行的for循环每隔五秒调用一次recvfrom函数，另外还添加了验证函数调用次数的语句，稍后再讲解延迟执行程序的原因

接下来的示例向之前的bound_host1.c传输数据，该示例共调用三次sendto以传输字符串数据

bound_host2.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

#define BUF_SIZE 30
void error_handling(char *message);

int main(int argc, char *argv[])
{
    int sock;
    char msg1[] = "Hi!";
    char msg2[] = "I'm another UDP host!";
    char msg3[] = "Nice to meet you";

    struct sockaddr_in your_adr;
    socklen_t your_adr_sz;
    if (argc != 3)
    {
        printf("Usage:%s<port>\n", argv[0]);
        exit(1);
    }
    sock = socket(PF_INET, SOCK_DGRAM, 0);
    if (sock == -1)
        error_handling("socket() error");
    memset(&your_adr, 0, sizeof(your_adr));
    your_adr.sin_family = AF_INET;
    your_adr.sin_addr.s_addr = inet_addr(argv[1]);
    your_adr.sin_port = htons(atoi(argv[2]));

    sendto(sock, msg1, sizeof(msg1), 0, (struct sockaddr *)&your_adr, sizeof(your_adr));
    sendto(sock, msg2, sizeof(msg2), 0, (struct sockaddr *)&your_adr, sizeof(your_adr));
    sendto(sock, msg3, sizeof(msg3), 0, (struct sockaddr *)&your_adr, sizeof(your_adr));
    close(sock);
    return 0;
}
void error_handling(char *message)
{
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

bound_host2.c程序调用三次sendto函数传输数据，bound_host1.c则调用三次recvfrom函数以接收数据。recvfrom函数调用间隔为五秒，因此调用recvfrom函数前已调用三次sendto函数。也就是说，此时数据已经传输到bound_host1.c上。如果是TCP程序，这时只需调用一次输入函数即可读入数据。UDP则不同，在这种情况下需要调用三次recvfrom函数，可通过下面的运行结果来验证

编译bound_host1.c并运行，UDP套接字监听8500端口等待数据传输

# gcc bound_host1.c -o bound_host1
# ./bound_host1 8500

编译bound_host2.c并运行向本机8500端口的UDP套接字发送数据

# gcc bound_host2.c -o bound_host2
# ./bound_host2 127.0.0.1 8500

bound_host2.c程序执行完毕后，bound_host1程序中的UDP套接字循环三次调用recvfrom读取数据

# ./bound_host1 8500
Message 1:Hi!
Message 2:I'm another UDP host!
Message 3:Nice to meet you

已连接（connected）UDP套接字与未连接（unconnected）UDP套接字

TCP套接字中需注册待传输数据的目标IP和端口号，而UDP中则无需注册。因此，通过sendto函数传输数据的过程大致可分为以下三个阶段：

第一阶段：向UDP套接字注册目标IP和端口号
第二阶段：传输数据
第三阶段：传输UDP套接字中注册的目标地址信息

每次调用sendto函数时重复上述过程，每次都变更目标地址，因此可以重复利用同一UDP套接字向不同目标传输数据。这种未注册目标地址信息的套接字称为未连接套接字，反之，注册了目标地址的套接字称为连接connected套接字。显然，UDP套接字默认属于未连接套接字。但是，要与同一主机进行长时间通信时，将UDP套接字变为已连接套接字会提高效率，上述三个阶段中，第一个阶段和第三个阶段将占用整个通信过程的1/3的时间，缩短这部分时间将大大提高性能

创建已连接的UDP套接字

创建已连接的UDP套接字很简单，只需针对UDP套接字调用connect函数

sock = socket(PF_INET, SOCK_DGRAM, 0);
memset(&adr, 0, sizeof(adr));
adr.sin_family = AF_INET;
adr.sin_addr.s_addr = .....;
adr.sin_port = ....;
connect(sock, (struct sockaddr *)&adr, sizeof(adr));

上述代码看似与TCP套接字创建过程一致，但socket函数的第二个参数是SOCK_DGRAM，也就是说，创建的的确是UDP套接字。当然，针对UDP套接字调用connect函数并不意味着要与对方的UDP套接字连接，这只是向UDP套接字注册目标IP和端口信息。之后就与TCP套接字一样，每次调用sendto函数只需传输数据，因为已经指定了收发对象，所以不仅可以使用sendto、recvfrom函数，还可以使用write、read函数进行通信

下面示例将之前的uecho_client.c程序修改为基于已连接UDP套接字的程序，因此可以结合uecho_server.c程序运行

uecho_con_client.c

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <unistd.h>
#include <arpa/inet.h>
#include <sys/socket.h>

#define BUF_SIZE 30
void error_handling(char *message);

int main(int argc, char *argv[])
{
    int sock;
    char message[BUF_SIZE];
    int str_len;
    struct sockaddr_in serv_adr;
    if (argc != 3)
    {
        printf("Usage:%s<port>\n", argv[0]);
        exit(1);
    }
    sock = socket(PF_INET, SOCK_DGRAM, 0);
    if (sock == -1)
        error_handling("socket() error");
    memset(&serv_adr, 0, sizeof(serv_adr));
    serv_adr.sin_family = AF_INET;
    serv_adr.sin_addr.s_addr = inet_addr(argv[1]);
    serv_adr.sin_port = htons(atoi(argv[2]));
    connect(sock, (struct sockaddr *)&serv_adr, sizeof(serv_adr));
    while (1)
    {
        fputs("Insert message(q to quit):", stdout);
        fgets(message, sizeof(message), stdin);
        if (!strcmp(message, "q\n") || !strcmp(message, "Q\n"))
            break;
        write(sock, message, strlen(message));

        str_len = read(sock, message, sizeof(message) - 1);
        message[str_len] = 0;
        printf("Message from server:%s", message);
    }
    close(sock);
    return 0;
}
void error_handling(char *message)
{
    fputs(message, stderr);
    fputc('\n', stderr);
    exit(1);
}

编译uecho_server.c并运行

# gcc uecho_server.c -o uecho_server
# ./uecho_server 8500

编译uecho_con_client.c并运行

# ./uecho_con_client 127.0.0.1 8500
Insert message(q to quit):Hello world!
Message from server:Hello world!
Insert message(q to quit):Spring
Message from server:Spring
Insert message(q to quit):Flask
Message from server:Flask
Insert message(q to quit):q

TCP/IP网络编程之基于UDP的服务端/客户端

猜你喜欢