网络套接字编程

【摘要】进程间通信使用的信号，通过在操作系统之间传递信号来实现进程之间的通信，也就是互相协作进行运行。线程间也是通过信号进行通信的，线程本质上来说是一个轻量级的进程。进程是资源分配的最小单位，线程是运行的最小单位。进程间切换保留上下文的开销远远大于线程，因为线程间的大部分资源是共享的，除了一些栈上的信息以及数据段和文件。
- 网络间的通信往往是多个主机之间进行的，因此使用信号进行通信那一套已经是不现实的了，为了解决这个问题，我们决定使用网络套接字进行网络间的通信。
- 网络间的通信本质上来说就是数据包的收发过程。要想把一个数据包从一个主机发送到另一个主机，需要遵照许多的协议，其中最有名的便是TCP/IP协议。数据包的传送大小一般都是按照帧来计算的。因为一个数据如果太大，必须要分解成为一个一个的小包裹来发送。
- 套接字是学习网络通信的基础，也是最重要的一个部分，因此我们必须熟练掌握。

套接字描述符

套接字描述符其实就是一个类似文件描述符的整型，在Linux的概念中，一切都是文件，那么网络也不意外。这里的描述符本质上就是一个数组的下标。使用原则还是从最小未被使用的开始算起。

#include <sys/scoket.h>
int scoket (int domain,int type ,
int protocol);//通常是0，表示给定的域和套接字类型选择默认协议
//返回值：若成功，返回套接字描述符，出错返回-1

SOCK_STREAM TCP可靠传输
SOCK_DGRAM  UDP不可靠传输 （两个对等进程之间通信时不需要逻辑连接，只需要对对等进程所使用的套接字送出一个报文
SOCK_STREAM 要求在交换数据之前，在本地套接字和通信的对等进程之间建立一个逻辑连接
从SOCK_STREAM套接字读数据时，它也许不会返回所有由发送进程所写的字节数，最终可以获得发送过来的所有数据，但有可能要通过若干次调用，因为数据包可能很大

SHUT_RD 只读
SHUT_WR 只写
SHUT_RDWR 既无法读数据也无法写数据

寻址

标识一个目标通信进程。进程标识由两部分组成，一部分是计算机的网络地址，它可以帮助标识网络上我们想与之通信的计算机，另一部分是该计算机上用端口号表示的服务，它可以帮助标识特定的进程。

字节序

网络协议指定了字节序，因此异构计算机系统能够交换协议信息而不会被字节序所混淆。TCP/IP协议使用大端字节序。
不管字节如何排序，最高有效字节总是在左边，最低有效字节总是在右边。
字节序也是一个协议，这个协议使得不同机器之间的通信称为可能并且很方便，因为这都是统一的标准

IP地址

IP协议有两个版本，IPv4和IPv6，默认使用的是IPv4
- IP地址是在IP协议中，用来标识网络中不同主机的地址
- 对IPv4来说，IP地址是一个4字节，32位的整数
- 我们通常使用“点分十进制”的字符串表示IP地址 192.168.0.1；用点分割的每一个数字表示一个字节，范围是0-255

源IP地址和目的IP地址

在IP数据包头部中，有两个IP地址，分别叫做源IP地址，目的IP地址

端口号

端口号是传输层协议的内容
- 端口号是一个2字节16位的整数
- 端口号用来标识一个进程，告诉操作系统，当前的这个数据要交给哪一个进程来处理
- IP地址+端口号能够标识网络上的某一台主机的某一个进程
- 一个端口号只能被一个进程占用

源端口号和目的端口号

传输层协议（TCP和UDP）的数据段中有两个端口号，分别叫做源端口号和目的端口号，就是在描述“数据是谁发的，要发给谁”

TCP协议和UDP协议

网络字节序

内存中的多字节数据相对于内存地址有大端和小端之分，磁盘文件中的多字节数据相对于文件中的偏移地址也有大端和小端之分，网络数据流也分大端小端
- 发送主机通常将发送缓冲区中的数据按内存地址从低到高的顺序发出
- 接收主机把从网络上接到的字节一次保存在接受缓冲区内，也是按内存地址从低到高的顺序保存
- 网络数据流的地址应该这样规定：先发出的数据是低地址，后发出的数据是高地址
- TCP/IP协议规定，网络数据流应采用大端字节序，即低地址高字节
- 不管这台主机是大端机还是小端机，都会按照这个TCP/IP规定的网络字节序来发送/接受数据
- 如果当前发送主机是小端，就需要先将数据转成大端，否则可以直接发送

四个用来在处理器字节序和网络字节序之间实施转换的函数

#include <arpa/inet.h>

unit32_t htonl(unit32_t  hostint32); //返回值，以网络字节序表示的32位整数
unit32_t htohs(unit16_t  hostint16); //返回值，以网络字节序表示的16位整数
unit32_t ntohl(unit32_t  netint32); //返回值，以主机字节序表示的32位整数
unit32_t ntohs(unit16_t  netint16); //返回值，以主机字节序表示的16位整数

socket编程接口

socket常见API

创建socket文件描述符（TCP/UDP，客户端 + 服务器）
int socket(int domain,int type,int protocol);

//绑定端口号（TCP/UDP,服务器）
int bind(int socket,const struct sockaddr *address,socklen_t address_len);

服务器程序所监听的网络地址和端口号通常是固定不变的，客户端程序得知服务器程序的地址和端口号后就可以向服务器发起连接，服务器需要调用bind绑定一个固定的网络地址和端口号

bind()的作用是将参数sockfd和myaddr绑定在一起，使sockfd这个用于网络通信的文件描述符监听myaddr所描述的地址和端口号

//开始监听socket（TCP,服务器）
int listen(int socket,int backlog);
listen()声明sockfd处于监听状态，并且最多允许有backlog 个客户端处于连接等待状态，如果接收到更多的连接请求就忽略，这里设置不会太大。listen成功返回0，失败返回-1
等待队列不能设置太大是为了保持高效性，以及资源的耗费会相对小一点，设置的太小，如果同时有一大批的连接断开，而服务器由于之前忽略了好多等待连接，一时不会不会有连接来，就会导致服务器处于长时间的空窗期，

//接受请求（TCP，服务器）
int accept(int socket,struct sockaddr* address,socklen_t *address_len);
三次握手完成后，服务器调用accept()接受连接
如果服务器调用accept()时还没有客户端的连接请求，就阻塞等待知道有客户端连接上来
- addr是一个传出参数，accept()返回时传出客户端的地址和端口号
- addrlen参数是一个传入传出参数，传入的是调用者提供的，缓冲区addr的长度以避免缓冲区溢出问题，传出的客户端地址结构体的实际长度（有可能没有占满调用者提供的缓冲区）

//建立连接（TCP，客户端）
int connect(int sockfd,const struct sockaddr *addr,socklen_t addrlen);
recvfrom(sock,buf,sizeof(buf)-1,0,(struct sockaddr*)&client,&len);

sendto(sock,buf,strlen(buf),0,(struct sockaddr*)&client,sizeof(client));

注意

客户端不是不允许调用bind()，只是没有必要调用bind()固定一个端口号，否则如果在同一台机器上启动多个客户端，就会出现端口号被占用导致不能正确建立连接
服务器也不是必须调用bind(),但如果服务器不调用bind(),内核会自动给服务器分配监听端口，每次启动服务器时端口号都不一样，客户端连接服务器就会遇到麻烦。

sockaddr结构

socket API是一层抽象的网络编程接口，适用于各种底层网络协议（IPv4,IPv6以及Unix Domain Socket,但是不同的网络协议的地址格式不相同
- IPv4和IPv6的地址格式定义在netinet/in.h中，IPv4地址用sockaddr_in结构体表示，包括16位地址类型，16位端口号和32位IP地址
- IPv4,IPv6地址类型分别定义为常数AF_INET,AF_INET6,这样，只要取得某种sockaddr结构体中的首地址，不需要知道具体是哪种类型的sockaddr结构体，就可以根据地址类型字段确定结构体中的内容
- socket API可以都用struct sockaddr*类型表示，在使用的时候需要强制转化为sockaddr_in,这样的好处是程序的通用性，可以接受各种类型的sockaddr结构体指针作为参数

地址转换函数

sockaddr_in中的成员struct in_addr sin_addr表示32位的IP地址，但是我们通常用点分十进制的字符串表示IP地址，以下函数可以在字符串表示和in_addr表示之间转换
- 字符串转in_addr的函数

#include<arpa/inet.h>

int inet_aton(const char* strptr,struct in_addr *addrptr); //字符串转网络地址
int_addr_t inet_addr(const char* strptr);   //
int inet_pton(int family,const char * strptr,void *addrptr); //端口号转为网络地址

in_addr转字符串的函数

char *inet_ntoa(struct in_addr inaddr); //网络地址转为字符串
const char*inet_ntop(int family,const void* addrptr,char *strptr,size_t len);
inet_ntop,这个函数由调用者提供一个缓冲区保存结果，可以规避线程安全问题

inet_ntoa这个函数返回一个char*,这个函数自己在内部为我们申请了一块内存来保存ip的结果
inet_ntoa函数是把这个返回结果放到了静态存储区，这个时候不需要我手动释放，如果多次调用，会造成覆盖问题

#include<stdlib.h>
#include<stdio.h>
#include<apra/inet.h>

int sock = socket(AF_INET,SOCK_DGRAM,0);
if(sock < 0) {
  perror("socket");
  return 2;
}

struct sockaddr_in local;
local.sin_family = AF_INET;
local.sin_port = htons(atoi(argv[2]));
local.sin_addr.s_addr = inet_addr(argv[1]);

if( bind(sock,(struct sockaddr*)&local,sizeof(local)) < 0) {
   perror("bind");
   return 3;
}

char buf[1024];
struct sockaddr_in  client;
while(1) {
   socklen_t len = sizeof(client);
   ssize_t s = recvfrom(sock,buf,sizeof(buf)-1,0,(struct sockaddr*)&client,&len);
  if( s > 0) {
       buf[s] = 0;
      printf("[%s:%d]:%s\n",inet_ntoa(client.sin_addr),ntohs(client.sin_port),buf);
   sendto(sock,buf,strlen(buf),0,(struct sockaddr*)&client,sizeof(client));
  }

}