socket编程方法,概念

蚓无爪牙之利,筋骨之强,上食埃土,下饮黄泉,用心一也而二非蛇鳝之穴无可寄托者,用心也。

---------------------------------------------------------------------------------------------------------------------------《劝学》--荀子



下内容参考自:https://blog.csdn.net/qq_26399665/article/details/52421723

哇呜!现在的网络编程,使用TCP/IP协议的应用程序几乎用的都是socket。

基本概念:

SOCKET(套接字):

Socket的英文原义是“孔”或“插座”,这里指的是 主机的IP地址+主机上的端口号。 

它是网络通信过程中端点的抽象表示,包含进行网络通信必需的五种信息:连接使用的协议(TCP or UDP),本地主机的IP地址,本地进程的协议端口,远地主机的IP地址,远地进程的协议端口

TCP/IP模型的层次: 应用层--传输层(TCP/UDP)--互联网层(IP/ARP/..)--硬件层,  应用层 和 传输层 通过套接字接口来通信。应用层可以同时运行很多服务,每个服务的进程对应唯一的端口号,从而可以通过端口号定位到具体的一个服务。

引用另一篇博客的话:“我们要讨论的是网络中进程之间如何通信?首要解决的问题是如何唯一标识一个进程,否则通信无从谈起!在本地可以通过进程PID来唯一标识一个进程,但是在网络中这是行不通的。其实TCP/IP协议族已经帮我们解决了这个问题,h互联网 层的  ip地址可以唯一标识网络中的主机,而传输层的“UDP/TCP+端口可以唯一标识主机中的应用程序(进程)。这样利用三元组(ip地址,协议,端口)就可以标识网络的进程了,网络中的进程通信就可以利用这个标志与其它进程进行交互。

socket起源于Unix,s而Unix/Linux基本哲学之一就是“一切皆文件”,都可以用“打开open –> 读写write/read –> 关闭close”模式来操作。我的理解就是Socket就是该模式的一个实现,socket即是一种特殊的文件,一些socket函数就是对其进行的操作(读/写IO、打开、关闭)”。

---------------------------------------------------------------------------------------------------------------------------------------------------------------------------

以TCP为例,介绍几个基本的socket接口函数:

1)socket()函数

int socket(int domain, int type, int protocol);

头文件#include <sys/socket.h>,linux自带函数。

socket函数对应于普通文件的打开操作。普通文件的打开操作返回一个文件描述字,而socket()用于创建一个socket描述符(socket descriptor),它唯一标识一个socket。这个socket描述字跟文件描述字一样,后续的操作都有用到它,把它作为参数,通过它来进行一些读写操作。

如果成功就返回生成的SOCKET,如果失败就返回INVALID_SOCKET(-1).

正如可以给fopen的传入不同参数值,以打开不同的文件。创建socket的时候,也可以指定不同的参数创建不同的socket描述符,socket函数的三个参数分别为:

 domain参数:协议族(family),常用的协议族有,AF_INETAF_INET6AF_LOCAL(或称AF_UNIX,Unix域socket)、AF_ROUTE等等。协议族决定了socket的地址类型,在通信中必须采用对应的地址,如AF_INET 决定了要用ipv4地址(32位的)与端口号(16位的)的组合、AF_UNIX决定了要用一个绝对路径名作为地址。

type参数:指定socket类型,常用的socket类型有,SOCK_STREAM、SOCK_DGRAM、SOCK_RAW、SOCK_PACKET、SOCK_SEQPACKET等等 。 

  1)SOCK_STREAM 提供有序的、可靠的、双向的和基于连接的字节流,使用带外数据传送机制,为Internet地址族使用TCP。带外数据传送:使用与普通数据不同的通道独立传送给用户,是相连的每一对流套接口间一个逻辑上独立的传输通道。

SOCK_STREAM类型的套接口为全双向的字节流。对于流类套接口,在接收或发送数据前必需处于已连接状态。用connect()调用建立与另一套接口的连接,连接成功后,即可用send()和recv()传送数据。当会话结束后,调用closesocket()。带外数据根据规定用send()和recv()来接收。 

  2)SOCK_DGRAM 支持无连接的、不可靠的和使用固定大小(通常很小)缓冲区的数据报服务,为Internet地址族使用UDP。

protocol参数指定协议,常用的协议有,IPPROTO_TCPIPPTOTO_UDPIPPROTO_SCTPIPPROTO_TIPC等,它们分别对应TCP传输协议、UDP传输协议、STCP传输协议、TIPC传输协议。---都是传输层的协议吧!

参数protocol为0对应 IPPROTO_IP,用于接收任何的IP数据包,其中的校验和和协议分析由程序自己完成。---???  

include/Linux/in.h里的定义:
/* Standard well-defined IP protocols. */
enum {
IPPROTO_IP = 0,   /* Dummy protocol for TCP   */
IPPROTO_ICMP = 1,   /* Internet Control Message Protocol */
IPPROTO_IGMP = 2,   /* Internet Group Management Protocol */
IPPROTO_IPIP = 4,   /* IPIP tunnels (older KA9Q tunnels use 94) */
IPPROTO_TCP = 6,   /* Transmission Control Protocol */
IPPROTO_EGP = 8,   /* Exterior Gateway Protocol   */
IPPROTO_PUP = 12,   /* PUP protocol     */
IPPROTO_UDP = 17,   /* User Datagram Protocol   */
IPPROTO_IDP = 22,   /* XNS IDP protocol    */
IPPROTO_DCCP = 33,   /* Datagram Congestion Control Protocol */
IPPROTO_RSVP = 46,   /* RSVP protocol    */
IPPROTO_GRE = 47,   /* Cisco GRE tunnels (rfc 1701,1702) */
IPPROTO_IPV6 = 41,   /* IPv6-in-IPv4 tunnelling   */
IPPROTO_ESP = 50,            /* Encapsulation Security Payload protocol */
IPPROTO_AH = 51,             /* Authentication Header protocol       */
IPPROTO_BEETPH = 94,        /* IP option pseudo header for BEET */
IPPROTO_PIM    = 103,   /* Protocol Independent Multicast */
IPPROTO_COMP   = 108,                /* Compression Header protocol */
IPPROTO_SCTP   = 132,   /* Stream Control Transport Protocol */
IPPROTO_UDPLITE = 136, /* UDP-Lite (RFC 3828)    */
IPPROTO_RAW = 255,   /* Raw IP packets    */
IPPROTO_MAX
};

并不是上面的type和protocol可以随意组合的,如SOCK_STREAM不可以跟IPPROTO_UDP组合。当protocol为0时,会自动选择type类型对应的默认协议。

当我们调用socket创建一个socket时,返回的socket描述字它存在于协议族(address family,AF_XXX)空间中,但没有一个具体的地址,其实在调用socket函数创建socket时,内核还并未给socket分配源地址和源端口。

2)bind()函数

int bind(int sockfd, const struct sockaddr *addr, socklen_t addrlen);

bind()函数把一个地址族中的特定地址赋给socket,例如对应AF_INETAF_INET6就是把一个ipv4或ipv6地址和端口号组合赋给socket。

函数的三个参数分别为:

    sockfd:即socket描述字,它是通过socket()函数创建,唯一标识一个socket

    addr:一个const struct sockaddr *指针,指向要绑定给sockfd的协议地址。这个地址结构根据地址创建socket时的地址协议族的不    同而不同,如ipv4对应的是: 

  • struct sockaddr_in {
        sa_family_t    sin_family; /* address family: AF_INET */
        in_port_t      sin_port;   /* port in network byte order */
        struct in_addr sin_addr;   /* internet address */
    };
    
    /* Internet address. */
    struct in_addr {
        uint32_t       s_addr;     /* address in network byte order */
    };

通常服务器在启动的时候都会绑定一个固定的地址(如ip地址+端口号),用于提供服务,客户端就可以通过它来找到这个服务器;而客户端就不用指定,有系统自动分配一个端口号和自身的ip地址组合。这就是为什么通常服务器端在listen之前会调用bind(),而客户端就不会调用,而是在connect()时由系统随机生成一个。

背景知识:网络字节序与主机字节序:

主机字节就是我们平常说的大端和小端模式:不同的CPU有不同的字节序类型,这些字节序是指整数在内存中保存的顺序,这个叫做主机序。引用标准的Big-Endian和Little-Endian的定义如下:
  a) Little-Endian就是低位字节排放在内存的低地址端,高位字节排放在内存的高地址端。
  b) Big-Endian反之。
网络字节序:4个字节的32 bit值以下面的次序传输:首先是0~7bit,其次8~15bit,然后16~23bit,最后是24~31bit。这种传输次序称作大端字节序。由于TCP/IP首部中所有的二进制整数在网络中传输时都要求以这种次序,因此它又称作网络字节序。字节序,顾名思义字节的顺序,就是大于一个字节类型的数据在内存中的存放顺序,一个字节的数据没有字节顺序的问题了


3)listen()、connect()函数

如果作为一个服务器,在调用socket()、bind()之后就会调用listen()来监听这个socket,如果客户端这时调用connect()发出连接请求,服务器端就会接收到这个请求。
int listen(int sockfd,  int backlog);

int connect(int sockfd,  const struct sockaddr *addr,  socklen_t addrlen);--- 客户端调用

listen函数的第一个参数即为要监听的socket描述字,第二个参数为相应socket可以排队的最大连接个数。socket()函数创建的socket默认是一个主动类型的,listen函数将socket变为被动类型的,等待客户的连接请求。

connect函数的第一个参数即为客户端的socket描述字,第二参数为服务器的socket地址,第三个参数为socket地址的长度。客户端通过调用connect函数来建立与TCP服务器的连接。

4)accept()函数

TCP服务器端依次调用socket()、bind()、listen()之后,就会监听指定的socket地址(bind()时自己为自己指定的,客户端向这个地址发送信息)了。

TCP客户端依次调用socket()、connect()之后就向TCP服务器发送了一个连接请求。TCP服务器监听到这个请求之后,就会调用accept()函数取接收请求,这样连接就建立好了。之后就可以开始网络I/O操作了,即类同于普通文件的读写I/O操作!!

int accept(int sockfd, struct sockaddr *addr, socklen_t *addrlen);
accept函数的第一个参数为服务器的socket描述字,第二个参数为指向struct sockaddr *的指针,用于返回客户端的协议地址,第三个参数为协议地址的长度。如果accpet成功,那么accept()返回值是由内核自动生成的一个全新的描述字,代表与返回客户的TCP连接。

注意:accept的第一个参数为服务器的socket描述字,是服务器开始调用socket()函数生成的,称为监听socket描述字;而accept函数返回的是已连接的socket描述字。一个服务器通常通常仅仅只创建一个监听socket描述字,它在该服务器的生命周期内一直存在。内核为每个服务器进程接受的 客户连接 创建了一个已连接socket描述字,当服务器完成了对某个客户的服务,相应的已连接socket描述字就被关闭。

5)read()、write()等函数
万事具备只欠东风,至此服务器与客户已经建立好连接了。可以调用网络I/O进行读写操作了,即实现了网咯中不同进程之间的通信!网络I/O操作有下面几组:

  • read()/write()
  • recv()/send()
  • readv()/writev()
  • recvmsg()/sendmsg()
  • recvfrom()/sendto()

6) close()函数

在服务器与客户端建立连接之后,会进行一些读写操作,完成了读写操作就要关闭相应的socket描述字,好比操作完打开的文件要调用fclose关闭打开的文件。

#include <unistd.h>
int close(int fd);

close一个TCP socket的缺省行为时把该socket标记为已关闭,然后立即返回到调用进程。该描述字不能再由调用进程使用,也就是说不能再作为read或write的第一个参数。

注意:close操作只是使相应socket描述字的引用计数-1,只有当引用计数为0的时候,才会触发TCP客户端向服务器发送终止连接请求。------???


一个栗子:

一个简单的服务器、客户端(使用TCP)——服务器端一直监听本机的6666号端口,如果收到连接请求,将接收请求并接收客户端发来的消息;客户端与服务器端建立连接并发送一条消息。

不管有多复杂的网络程序,都使用的这些基本函数。上面的服务器使用的是迭代模式的,即只有处理完一个客户端请求才会去处理下一个客户端的请求,这样的服务器处理能力是很弱的,现实中的服务器都需要有并发处理能力!为了需要并发处理,服务器需要fork()一个新的进程或者线程去处理请求等。
服务器端
复制代码
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<errno.h>
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>

#define MAXLINE 4096

int main(int argc, char** argv)
{
    int    listenfd, connfd;
    struct sockaddr_in     servaddr;
    char    buff[4096];
    int     n;

    if( (listenfd = socket(AF_INET, SOCK_STREAM, 0)) == -1 ){//------------------建立服务器端的socket
        printf("create socket error: %s(errno: %d)\n",strerror(errno),errno);
        exit(0);
    }

    memset(&servaddr, 0, sizeof(servaddr));
    servaddr.sin_family = AF_INET;
    servaddr.sin_addr.s_addr = htonl(INADDR_ANY);
    servaddr.sin_port = htons(6666);

    if( bind(listenfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) == -1){//--指定服务器的IP地址和端口号
        printf("bind socket error: %s(errno: %d)\n",strerror(errno),errno);
        exit(0);
    }

    if( listen(listenfd, 10) == -1){//  ----------------------------------------令服务器来监听这个socket口!!!
        printf("listen socket error: %s(errno: %d)\n",strerror(errno),errno);
        exit(0);
    }

    printf("======waiting for client's request======\n");
    while(1){
        if( (connfd = accept(listenfd, (struct sockaddr*)NULL, NULL)) == -1){//---等待客户端发送数据过来,,
                                    //accept()返回值是由内核自动生成的一个全新的socket描述字,代表客户端的TCP连接信息
            printf("accept socket error: %s(errno: %d)",strerror(errno),errno);
            continue;
        }
        n = recv(connfd, buff, MAXLINE, 0);//-------------------------------------接受到的数据放到buff中
        buff[n] = '\0';
        printf("recv msg from client: %s\n", buff);
        close(connfd);
    }

    close(listenfd);
}

客户端:

#include<stdio.h> 
#include<stdlib.h> 
#include<string.h> 
#include<errno.h> 
#include<sys/types.h>
#include<sys/socket.h>
#include<netinet/in.h>
#define MAXLINE 4096 
 int main(int argc, char** argv) 
 {
 
	int sockfd, n;
 
	char recvline[4096], sendline[4096];
 
	struct sockaddr_in servaddr;

	if( argc != 2)
	{
	 printf("usage: ./client <ipaddress>\n");
	 exit(0);
	}
	if( (sockfd = socket(AF_INET, SOCK_STREAM, 0)) < 0)//------------建立socket
	{
	 printf("create socket error: %s(errno: %d)\n", strerror(errno),errno);
	 exit(0);
	}
	 
	memset(&servaddr, 0, sizeof(servaddr));
	servaddr.sin_family = AF_INET;
	servaddr.sin_port = htons(6666);
	
	//inet_pton是一个IP地址转换函数,可以在将IP地址在“点分十进制”和“二进制整数”之间转换而且,
	//inet_pton和inet_ntop这2个函数能够处理ipv4和ipv6。算是比较新的函数
	if( inet_pton(AF_INET, argv[1], &servaddr.sin_addr) <= 0)
	{
		 printf("inet_pton error for %s\n",argv[1]);
		 exit(0);
	}
	if( connect(sockfd, (struct sockaddr*)&servaddr, sizeof(servaddr)) < 0)//指定服务端的IP和端口地址给socket
	{
		 printf("connect error: %s(errno: %d)\n",strerror(errno),errno);
		 exit(0);
	}
	printf("send msg to server: \n");
	fgets(sendline, 4096, stdin);//------------用户输入数据
	if( send(sockfd, sendline, strlen(sendline), 0) < 0) //-----------发送一次数据给服务器端
	{
		 printf("send msg error: %s(errno: %d)\n", strerror(errno), errno);
		 exit(0);
	}
	close(sockfd);//关闭socket
	exit(0);
 }

REF:

https://blog.csdn.net/qq_26399665/article/details/52421723

猜你喜欢

转载自blog.csdn.net/qq_35865125/article/details/80468549