Linux——UDP协议与相关套接字编程

一.概念

在网络通信中,传输层中最常用的通信协议有两个:TCP协议与UDP协议。这两种协议虽然都可以用于网络通信,但是通信方式不同决定了应用场景的不同。

与TCP协议相比,UDP协议最具特色的不同点有两个:无连接与面向数据报

(一).无连接

所谓无连接就是通信的双方不需要在已建立联系的前提下通信,换句话说就是信息发送方只管发送数据,不需要判断对方是否能够接收到数据。我们知道使用TCP协议通信前,需要让双方“连接”,即客户端发送连接请求,服务器端接收后与之连接,只有在连接成功后双方才能互相发送数据。但是UDP协议的双方不需要提前建立“连接”,需要发送数据时直接发送,“不在乎”对方是否接收。因此相较于TCP协议而言,UDP协议较为不安全(不可靠),有数据丢失的可能。

那可能会有人有疑问,既然UDP协议的通信方式如此不安全,为什么还会有UDP通信协议的存在呢。这是因为虽然UDP的通信方式不安全,但是通信成本较低,通信方式简单,效率高。比如我们观看网络直播晚会正常就是采用的UDP协议,因此会出现观看中突然卡顿的现象,这极有可能就是UDP发送时出现数据丢失。同时因为观看人数极多,如果采用TCP协议那种与每一个用户建立连接又会消耗大量资源。偶尔卡顿对观看体验的降低远小于采用TCP协议所消耗的大量成本。因此网络直播大多采用UDP协议。同样地,如果是非常重要的小众会议,那么就会采用TCP协议通信。

因此,UDP协议一般用于通信人数多且对传输数据质量要求低的通信形式(比如直播)。

(二).面向数据报

所谓面向数据报指的是UDP发送数据时不管报文长度,一次发送一整个报文。因此采用UDP协议的通信需要规定好报文长度,如果报文过长那么IP层需要切片,降低通信效率。而与UDP不同的是TCP协议采用面向字节流的发送方式,含义可以参考输入输出流,TCP内部有一个缓冲区,如果报文过长,那么就可以一部分一部分的推送。打个比方当我们买苹果时,面向数据报就好比商家把苹果一个一个交给我们手上,面向字节流就是商家把一堆苹果装在一个盒子里后,把这个盒子交给我们。

二.相关套接字编程

(一).什么是套接字

套接字英文名为socket,直译是“插座”。插座是用于连接电源和电器,达到通电的效果。而套接字是让应用层与传输层通过IP和端口号port锁定其他网络中的进程来达到通信的目的。因此套接字由IP地址、端口号port以及通信协议方式(TCP/UDP)组成

我们知道,在网络通信中通过一个IP地址可以锁定一台主机,通过端口号可以锁定一台主机上某一个进程。因此IP地址+端口号可以锁定全网中唯一的进程,进而达到通信的目的。用户通过使用套接字,调用相关API接口,就可以与其他主机网络通信,本质是与其他主机的某一个进程通信。而对方用户接收、返回数据也是使用套接字,调用相关接口。这种使用套接字,调用接口从而进行网络通信的方式就是套接字编程。

(二).UDP套接字编程

首先,我们应该先了解采用UDP通信协议的套接字编程大体流程。

头文件<sys/socket.h>、<sys/types.h>

①获取套接字

调用linux系统接口socket,获取一个套接字。

第一个参数用来确定套接字类型。我们知道套接字分为三种:网络套接字、域间套接字、原始套接字。在网络通信中采用网络套接字类型,因此第一个参数需要填入宏AF_INET,代表采用网络套接字。

第二个参数用来确定套接字的协议类型(TCP/UDP)。如果是采用UDP协议就是宏SOCK_DGRAM,代表面向数据报通信。

第三个参数是用来确定通信的协议家族。一般填0,代表用户不指定协议类型,由服务商选择通信协议。

返回值是一个文件描述符。本质就是打开了一个文件(linux下一切皆文件),因此该文件描述符会占用进程中files_struct结构体中fd_array数组一个下标。如果打开失败就会返回-1并设置错误码errno。

示例如下:

int sockfd = socket(AF_INET, SOCK_DGRAM, 0);

②创建带有本机器IP地址和本进程端口号的结构体

使用结构体类型为struct sockaddr_in类型,进行网络通信时就是通过该结构体中记录地址找到通信目标。

//struct sockaddr_in类型内部结构
#define    __SOCKADDR_COMMON(sa_prefix) \
  sa_family_t sa_prefix##family

/* Structure describing an Internet socket address.  */
struct sockaddr_in
  {
    __SOCKADDR_COMMON (sin_);
    in_port_t sin_port;            /* Port number.  */
    struct in_addr sin_addr;        /* Internet address.  */

    /* Pad to size of `struct sockaddr'.  */
    unsigned char sin_zero[sizeof (struct sockaddr) -
               __SOCKADDR_COMMON_SIZE -
               sizeof (in_port_t) -
               sizeof (struct in_addr)];
  };

struct sockaddr_in结构体内部有三个参数:sin_family、sin_port、sin_addr

第一个参数sin_family用以确定套接字类型,网络通信中就是网络套接字,即AF_INET。

struct sockaddr_in addr;
addr.sin_family = AF_INET;

第二个参数sin_port用于确定该套接字需要连接的端口号,即本进程端口号。

这里需要格外注意的是,因为端口号需要用于网络传输使用,在网络中统一采用大端存储的网络字节序。linux提供了接口htons来将数据转为大端存储形式:

记忆这些函数的方法很简单,htons即代表host(主机)to(转到)net(网络)采用short短整形(uint16_t)的形式。其他函数类比即可。

uint16_t port = ...//端口号
addr.sin_port = htons(port);

第三个参数sin_addr用来表示本主机对应的IP地址。因为我们输入的IP地址一般采用字符串类型,但是在网络中需要使用in_addr_t类型(本质就是32位无符号整数)。

因此采用函数inet_addr可以将字符串转为in_addr_t类型,或者函数inet_aton:

inet_aton函数如果成功返回非0,失败返回0。

string IP = "127.0.0.1";//示例
addr.sin_addr.s_addr = inet_addr(IP.c_str());//方式一
int i = inet_aton(IP.c_str(), addr.sin_addr.s_addr);//方式二

③绑定:绑定结构体与套接字

在创建好记录IP地址和端口号的结构体struct sockaddr_in之后,需要将该结构体和套接字绑定到一起,调用bind接口进行绑定:

该函数第一个参数是我们需要绑定的套接字文件描述符,也就是socket函数的返回值。

第二个参数是要绑定的网络通信结构体,也就是我们第二步创建的struct sockaddr_in。因为bind函数采用struct sockaddr类型,因此需要将我们创建的结构体强转一下。那么可能有人会有疑问,bind函数参数为什么是struct sockaddr类型而不是struct sockaddr_in类型呢,这俩有什么区别么?

——有区别,struct sockaddr类型是早期的网络通信结构体,但是其内部结构并不合理,IP地址与端口号都采用成员sa_data来表示:

//struct sockaddr类型内部结构
/* Structure describing a generic socket address.  */
struct sockaddr
  {
    __SOCKADDR_COMMON (sa_);    /* Common data: address family and length.  */
    char sa_data[14];        /* Address data.  */
  };

因此后来出现了struct sockaddr_in类型,能够将IP地址和端口号用两个成员分开表示。

bind函数第三个参数是struct sockaddr类型结构体的大小。

返回值为0代表绑定成功,-1代表绑定失败。

int i = bind(sockfd, (struct sockaddr*)&addr, sizeof addr);
if(i < 0)
{
    //绑定失败
}
//绑定成功

④通信(发送 & 接收)

发送时,采用sendto系统接口。根据目标地址的IP地址和端口号(或者说struct sockaddr结构体)将数据发送过去。

该函数第一个参数是本进程使用的套接字文件描述符(给对方发数据要把自己的信息传过去,这样对方才能回复)。

第二个参数是指针类型,指向要发送数据。第三个参数是数据大小。这两个参数可以参考write函数第二、三个参数含义。

第4个参数代表发送数据策略,一般填0代表正常操作。具体可以参考这篇博客:linux socket中 send recv函数的 flags参数

第四、五个参数代表数据接收方的struct sockaddr结构体。在使用sendto函数之前,要先获取到对方的IP地址和端口号,创建struct sockaddr_in结构体后,再调用sendto函数。

返回值为实际发送数据的长度,发送失败返回-1。

示例如下:

char buf[1024];
//制作数据...
struct sockaddr_in client;//创建数据目标接收方的结构体
//记录接收方的IP地址和端口号
int i = sendto(sockfd, buf, strlen(buf), 0, (struct sockaddr*)&client, sizeof client);//发送数据
if(i < 0)
{
    //发送失败
}

上述示例中有一点需要注意,发送数据的大小应该是实际数据的长度,而不是整个buf容器的大小。当然UDP协议采用面向数据报的形式,传buf大小没有关系,但如果是TCP协议那样采用字节流的形式时就会出错,这一点将在讲解TCP协议的博客中说明。

接收时,采用recvfrom函数。在没有接收到数据之前会阻塞在recvfrom函数上。

该函数第一个参数同sendto函数,也是本进程创建的套接字文件描述符。

第二个参数为输出型参数,用于获取接收到的数据。第三个参数是提供的接收数据容器的大小。这两个参数含义同系统read函数第二、三个参数。

第四个参数含义同sendto函数,不再解释,一般填0。

第五、六个参数也是输出型参数,用于获取数据发送方的网络通信结构体和结构体长度。本质是为了获取对方的IP地址和端口号,便于我方向对方主机回复数据。

返回值代表实际接收到的数据大小,接收失败返回-1。值得一提的是,如果对方进程关闭了,recvfrom函数并不会返回-1,而是一直阻塞。

示例如下:

char buf[1024];//用于接收数据
struct sockaddr_in server;
socklen_t leng = sizeof server;
int i = recvfrom(sockfd, buf, sizeof buf - 1, 0, (struct sockaddr*)&server, &leng);
//此时server内部记录的已经是发送方的IP地址和端口号
if(i < 0)
{
    //接收失败
}
buf[i] = '\0';

(三).UDP协议通信场景模拟

①服务端

服务端的任务有三个:建立UDP协议、等待接收客户端数据、处理数据后发送给客户端。

需要注意的是实际开发中服务器启动后就会一直运行,因此服务器接收、处理、发送数据的程序应该是死循环。

同时因为实际中一个服务器会有多个网卡即多个IP地址,采用INADDR_ANY宏定义记录IP地址后,服务器会监听本机所有IP地址。INADDR_ANY本质就是"0.0.0.0"。

伪代码如下:

class Server
{
public:
    Server(const uint16_t port)//获取端口号
        : _port(port)
    {}
    bool initServer()//初始化服务器
    {
        // 获取套接字(插座)
        _socket = socket(AF_INET, SOCK_DGRAM, 0);
        ...
        // 创建本端口结构体
        struct sockaddr_in local;        
        ...
        local.sin_addr.s_addr = INADDR_ANY;//监听本机所有IP地址        
        // 绑定
        int i = bind(_socket, (struct sockaddr *)&local, sizeof local);
        ...
        return true;
    }
    void startServer()//启动服务器
    {
        char buf[1024]; // 接收数据的缓冲区
        // 启动服务器,死循环
        for (;;)
        {
            // 接收数据
            ...
            ssize_t i = recvfrom(_socket, buf, sizeof buf, 0, (struct sockaddr *)&client, &len);
            if (i > 0)
            {
                ...//处理数据  
                //处理后将数据交给客户端            
                sendto(_socket, replyBuf.c_str(), replyBuf.size(), 0, (struct sockaddr *)&client, sizeof client);
            }
            else
            {
                ...//接收数据失败
            }
            bzero(&buf, sizeof(buf));
        }
    }

private:
    uint16_t _port;
    int _socket;
};

②客户端

客户端的任务有三个:获取服务器端套接字、发送数据给服务器、接收服务器数据。同服务器端一样,也采用死循环的形式。

需要注意的是,客户端在通信时只需要提前建立好本机套接字,并不需要绑定到特定端口号和IP地址,这是因为可能会有多个客户端,如果同时绑定的话可能会发生绑到同一个端口的错误行为,因此绑定的任务直接交给操作系统。

伪代码如下:

//客户端启动格式: ./client.cpp 服务端IP地址 服务端端口号
int main(int argc, char *argv[])
{
    if (argc != 3)
    {
        ...//格式错误
    }
    //建立本机套接字
    sockfd = socket(AF_INET, SOCK_DGRAM, 0);
    //确定服务端IP和端口号,通信使用
    struct sockaddr_in svr;
    bzero(&svr, sizeof(svr));
    svr.sin_family = AF_INET;
    svr.sin_addr.s_addr = inet_addr(argv[1]);
    svr.sin_port = htons(atoi(argv[2]));
    for (;;)//死循环
    {
        ...//客户端制造数据
        //发送数据给服务器
        sendto(fd, str.c_str(), str.size(), 0, (struct sockaddr *)&svr, sizeof svr);
        struct sockaddr_in addr;//用于记录服务器IP和端口
        ...
        //接收服务器数据
        recvfrom(fd, buf, sizeof buf, 0, (struct sockaddr *)&addr, &len);
        ...//处理服务器数据
    }
    return 0;
}

任何优秀的大软件里面都是一个优秀的小程序。— Charles Antony Richard Hoare


如有错误,敬请斧正

猜你喜欢

转载自blog.csdn.net/weixin_61857742/article/details/129130532
今日推荐