一.概念

在网络通信中，传输层中最常用的通信协议有两个：TCP协议与UDP协议。这两种协议虽然都可以用于网络通信，但是通信方式不同决定了应用场景的不同。

与TCP协议相比，UDP协议最具特色的不同点有两个：无连接与面向数据报。

（一）.无连接

所谓无连接就是通信的双方不需要在已建立联系的前提下通信，换句话说就是信息发送方只管发送数据，不需要判断对方是否能够接收到数据。我们知道使用TCP协议通信前，需要让双方“连接”，即客户端发送连接请求，服务器端接收后与之连接，只有在连接成功后双方才能互相发送数据。但是UDP协议的双方不需要提前建立“连接”，需要发送数据时直接发送，“不在乎”对方是否接收。因此相较于TCP协议而言，UDP协议较为不安全（不可靠），有数据丢失的可能。

那可能会有人有疑问，既然UDP协议的通信方式如此不安全，为什么还会有UDP通信协议的存在呢。这是因为虽然UDP的通信方式不安全，但是通信成本较低，通信方式简单，效率高。比如我们观看网络直播晚会正常就是采用的UDP协议，因此会出现观看中突然卡顿的现象，这极有可能就是UDP发送时出现数据丢失。同时因为观看人数极多，如果采用TCP协议那种与每一个用户建立连接又会消耗大量资源。偶尔卡顿对观看体验的降低远小于采用TCP协议所消耗的大量成本。因此网络直播大多采用UDP协议。同样地，如果是非常重要的小众会议，那么就会采用TCP协议通信。

因此，UDP协议一般用于通信人数多且对传输数据质量要求低的通信形式（比如直播）。

（二）.面向数据报

所谓面向数据报指的是UDP发送数据时不管报文长度，一次发送一整个报文。因此采用UDP协议的通信需要规定好报文长度，如果报文过长那么IP层需要切片，降低通信效率。而与UDP不同的是TCP协议采用面向字节流的发送方式，含义可以参考输入输出流，TCP内部有一个缓冲区，如果报文过长，那么就可以一部分一部分的推送。打个比方当我们买苹果时，面向数据报就好比商家把苹果一个一个交给我们手上，面向字节流就是商家把一堆苹果装在一个盒子里后，把这个盒子交给我们。

二.相关套接字编程

（一）.什么是套接字

套接字英文名为socket，直译是“插座”。插座是用于连接电源和电器，达到通电的效果。而套接字是让应用层与传输层通过IP和端口号port锁定其他网络中的进程来达到通信的目的。因此套接字由IP地址、端口号port以及通信协议方式（TCP/UDP）组成。

我们知道，在网络通信中通过一个IP地址可以锁定一台主机，通过端口号可以锁定一台主机上某一个进程。因此IP地址+端口号可以锁定全网中唯一的进程，进而达到通信的目的。用户通过使用套接字，调用相关API接口，就可以与其他主机网络通信，本质是与其他主机的某一个进程通信。而对方用户接收、返回数据也是使用套接字，调用相关接口。这种使用套接字，调用接口从而进行网络通信的方式就是套接字编程。

（二）.UDP套接字编程

首先，我们应该先了解采用UDP通信协议的套接字编程大体流程。

头文件<sys/socket.h>、<sys/types.h>

①获取套接字

调用linux系统接口socket，获取一个套接字。

第一个参数用来确定套接字类型。我们知道套接字分为三种：网络套接字、域间套接字、原始套接字。在网络通信中采用网络套接字类型，因此第一个参数需要填入宏AF_INET，代表采用网络套接字。

第二个参数用来确定套接字的协议类型（TCP/UDP）。如果是采用UDP协议就是宏SOCK_DGRAM，代表面向数据报通信。

第三个参数是用来确定通信的协议家族。一般填0,代表用户不指定协议类型，由服务商选择通信协议。

返回值是一个文件描述符。本质就是打开了一个文件（linux下一切皆文件），因此该文件描述符会占用进程中files_struct结构体中fd_array数组一个下标。如果打开失败就会返回-1并设置错误码errno。

示例如下：

int sockfd = socket(AF_INET, SOCK_DGRAM, 0);

②创建带有本机器IP地址和本进程端口号的结构体

使用结构体类型为struct sockaddr_in类型，进行网络通信时就是通过该结构体中记录地址找到通信目标。

//struct sockaddr_in类型内部结构
#define    __SOCKADDR_COMMON(sa_prefix) \
  sa_family_t sa_prefix##family

/* Structure describing an Internet socket address.  */
struct sockaddr_in
  {
    __SOCKADDR_COMMON (sin_);
    in_port_t sin_port;            /* Port number.  */
    struct in_addr sin_addr;        /* Internet address.  */

    /* Pad to size of `struct sockaddr'.  */
    unsigned char sin_zero[sizeof (struct sockaddr) -
               __SOCKADDR_COMMON_SIZE -
               sizeof (in_port_t) -
               sizeof (struct in_addr)];
  };

struct sockaddr_in结构体内部有三个参数：sin_family、sin_port、sin_addr。

第一个参数sin_family用以确定套接字类型，网络通信中就是网络套接字，即AF_INET。

struct sockaddr_in addr;
addr.sin_family = AF_INET;

第二个参数sin_port用于确定该套接字需要连接的端口号，即本进程端口号。

这里需要格外注意的是，因为端口号需要用于网络传输使用，在网络中统一采用大端存储的网络字节序。linux提供了接口htons来将数据转为大端存储形式：

记忆这些函数的方法很简单，htons即代表host（主机）to（转到）net（网络）采用short短整形（uint16_t）的形式。其他函数类比即可。

uint16_t port = ...//端口号
addr.sin_port = htons(port);

第三个参数sin_addr用来表示本主机对应的IP地址。因为我们输入的IP地址一般采用字符串类型，但是在网络中需要使用in_addr_t类型（本质就是32位无符号整数）。

因此采用函数inet_addr可以将字符串转为in_addr_t类型，或者函数inet_aton：

inet_aton函数如果成功返回非0，失败返回0。

string IP = "127.0.0.1";//示例
addr.sin_addr.s_addr = inet_addr(IP.c_str());//方式一
int i = inet_aton(IP.c_str(), addr.sin_addr.s_addr);//方式二

③绑定：绑定结构体与套接字

在创建好记录IP地址和端口号的结构体struct sockaddr_in之后，需要将该结构体和套接字绑定到一起，调用bind接口进行绑定：

该函数第一个参数是我们需要绑定的套接字文件描述符，也就是socket函数的返回值。

第二个参数是要绑定的网络通信结构体，也就是我们第二步创建的struct sockaddr_in。因为bind函数采用struct sockaddr类型，因此需要将我们创建的结构体强转一下。那么可能有人会有疑问，bind函数参数为什么是struct sockaddr类型而不是struct sockaddr_in类型呢，这俩有什么区别么？

——有区别，struct sockaddr类型是早期的网络通信结构体，但是其内部结构并不合理，IP地址与端口号都采用成员sa_data来表示：

//struct sockaddr类型内部结构
/* Structure describing a generic socket address.  */
struct sockaddr
  {
    __SOCKADDR_COMMON (sa_);    /* Common data: address family and length.  */
    char sa_data[14];        /* Address data.  */
  };

因此后来出现了struct sockaddr_in类型，能够将IP地址和端口号用两个成员分开表示。

bind函数第三个参数是struct sockaddr类型结构体的大小。

返回值为0代表绑定成功，-1代表绑定失败。

int i = bind(sockfd, (struct sockaddr*)&addr, sizeof addr);
if(i < 0)
{
    //绑定失败
}
//绑定成功

④通信（发送 & 接收）

发送时，采用sendto系统接口。根据目标地址的IP地址和端口号（或者说struct sockaddr结构体）将数据发送过去。

该函数第一个参数是本进程使用的套接字文件描述符（给对方发数据要把自己的信息传过去，这样对方才能回复）。

第二个参数是指针类型，指向要发送数据。第三个参数是数据大小。这两个参数可以参考write函数第二、三个参数含义。

第4个参数代表发送数据策略，一般填0代表正常操作。具体可以参考这篇博客：linux socket中 send recv函数的 flags参数

第四、五个参数代表数据接收方的struct sockaddr结构体。在使用sendto函数之前，要先获取到对方的IP地址和端口号，创建struct sockaddr_in结构体后，再调用sendto函数。

返回值为实际发送数据的长度，发送失败返回-1。

示例如下：

char buf[1024];
//制作数据...
struct sockaddr_in client;//创建数据目标接收方的结构体
//记录接收方的IP地址和端口号
int i = sendto(sockfd, buf, strlen(buf), 0, (struct sockaddr*)&client, sizeof client);//发送数据
if(i < 0)
{
    //发送失败
}

上述示例中有一点需要注意，发送数据的大小应该是实际数据的长度，而不是整个buf容器的大小。当然UDP协议采用面向数据报的形式，传buf大小没有关系，但如果是TCP协议那样采用字节流的形式时就会出错，这一点将在讲解TCP协议的博客中说明。

接收时，采用recvfrom函数。在没有接收到数据之前会阻塞在recvfrom函数上。

该函数第一个参数同sendto函数，也是本进程创建的套接字文件描述符。

第二个参数为输出型参数，用于获取接收到的数据。第三个参数是提供的接收数据容器的大小。这两个参数含义同系统read函数第二、三个参数。

第四个参数含义同sendto函数，不再解释，一般填0。

第五、六个参数也是输出型参数，用于获取数据发送方的网络通信结构体和结构体长度。本质是为了获取对方的IP地址和端口号，便于我方向对方主机回复数据。

返回值代表实际接收到的数据大小，接收失败返回-1。值得一提的是，如果对方进程关闭了，recvfrom函数并不会返回-1，而是一直阻塞。

示例如下：

char buf[1024];//用于接收数据
struct sockaddr_in server;
socklen_t leng = sizeof server;
int i = recvfrom(sockfd, buf, sizeof buf - 1, 0, (struct sockaddr*)&server, &leng);
//此时server内部记录的已经是发送方的IP地址和端口号
if(i < 0)
{
    //接收失败
}
buf[i] = '\0';

（三）.UDP协议通信场景模拟

①服务端

服务端的任务有三个：建立UDP协议、等待接收客户端数据、处理数据后发送给客户端。

需要注意的是实际开发中服务器启动后就会一直运行，因此服务器接收、处理、发送数据的程序应该是死循环。

同时因为实际中一个服务器会有多个网卡即多个IP地址，采用INADDR_ANY宏定义记录IP地址后，服务器会监听本机所有IP地址。INADDR_ANY本质就是"0.0.0.0"。

伪代码如下：

class Server
{
public:
    Server(const uint16_t port)//获取端口号
        : _port(port)
    {}
    bool initServer()//初始化服务器
    {
        // 获取套接字（插座）
        _socket = socket(AF_INET, SOCK_DGRAM, 0);
        ...
        // 创建本端口结构体
        struct sockaddr_in local;        
        ...
        local.sin_addr.s_addr = INADDR_ANY;//监听本机所有IP地址        
        // 绑定
        int i = bind(_socket, (struct sockaddr *)&local, sizeof local);
        ...
        return true;
    }
    void startServer()//启动服务器
    {
        char buf[1024]; // 接收数据的缓冲区
        // 启动服务器，死循环
        for (;;)
        {
            // 接收数据
            ...
            ssize_t i = recvfrom(_socket, buf, sizeof buf, 0, (struct sockaddr *)&client, &len);
            if (i > 0)
            {
                ...//处理数据  
                //处理后将数据交给客户端            
                sendto(_socket, replyBuf.c_str(), replyBuf.size(), 0, (struct sockaddr *)&client, sizeof client);
            }
            else
            {
                ...//接收数据失败
            }
            bzero(&buf, sizeof(buf));
        }
    }

private:
    uint16_t _port;
    int _socket;
};

②客户端

客户端的任务有三个：获取服务器端套接字、发送数据给服务器、接收服务器数据。同服务器端一样，也采用死循环的形式。

需要注意的是，客户端在通信时只需要提前建立好本机套接字，并不需要绑定到特定端口号和IP地址，这是因为可能会有多个客户端，如果同时绑定的话可能会发生绑到同一个端口的错误行为，因此绑定的任务直接交给操作系统。

伪代码如下：

//客户端启动格式： ./client.cpp 服务端IP地址 服务端端口号
int main(int argc, char *argv[])
{
    if (argc != 3)
    {
        ...//格式错误
    }
    //建立本机套接字
    sockfd = socket(AF_INET, SOCK_DGRAM, 0);
    //确定服务端IP和端口号，通信使用
    struct sockaddr_in svr;
    bzero(&svr, sizeof(svr));
    svr.sin_family = AF_INET;
    svr.sin_addr.s_addr = inet_addr(argv[1]);
    svr.sin_port = htons(atoi(argv[2]));
    for (;;)//死循环
    {
        ...//客户端制造数据
        //发送数据给服务器
        sendto(fd, str.c_str(), str.size(), 0, (struct sockaddr *)&svr, sizeof svr);
        struct sockaddr_in addr;//用于记录服务器IP和端口
        ...
        //接收服务器数据
        recvfrom(fd, buf, sizeof buf, 0, (struct sockaddr *)&addr, &len);
        ...//处理服务器数据
    }
    return 0;
}

任何优秀的大软件里面都是一个优秀的小程序。— Charles Antony Richard Hoare

如有错误，敬请斧正

Linux——UDP协议与相关套接字编程

一.概念

（一）.无连接

（二）.面向数据报

二.相关套接字编程

（一）.什么是套接字

（二）.UDP套接字编程

①获取套接字

②创建带有本机器IP地址和本进程端口号的结构体

③绑定：绑定结构体与套接字

④通信（发送 & 接收）

（三）.UDP协议通信场景模拟

①服务端

②客户端

猜你喜欢