Linux内核:进程管理——管道、套接字

管道

管道是操作系统提供的一种最基本的进程间通信方式。每创建一个管道,就有两个文件描述符,一个是负责读管道的,一个是负责写管道的。所以,使用管道通信时,可以看作是两个文件描述符加一段内核空间中的内存,如图。

管道只能协调有亲缘关系的进程间通信,所谓亲缘,比如父子进程、兄弟进程。当某进程创建一个管道后,它就拥有了这个管道的两个文件描述符,它的子进程会继承这两个文件描述符,所以子进程也能读写这个管道。如图。

但为了让管道通信更安全、更方便,一般管道两端的每个进程都会各自关闭一个管道的文件描述符,例如父进程关闭读描述符,这样父进程只能向管道写数据,子进程关闭写描述符,这样子进程只能从管道读数据。或者相反。如图。

Shell也提供了管道,只需使用一根竖线连接两个命令即可。例如:

[root@docker-03 ~]# ps -elf | grep "sshd"
4 S root        939      1  0  80   0 - 26519 poll_s 18:15 ?        00:00:00 /usr/sbin/sshd -D
4 S root       1306    939  0  80   0 - 37099 poll_s 18:16 ?        00:00:00 sshd: root@pts/0
0 S root       1417   1308  0  80   0 - 28182 pipe_w 19:23 pts/0    00:00:00 grep --color=auto sshd
[root@docker-03 ~]# cat a.log | grep "hello world"

在shell下,这种管道称为匿名管道,即没有名称的管道。它对于编写命令行来说非常方便,且逻辑清晰易懂,shell脚本和shell命令行几乎靠它打下了半壁江山。

在shell下,还支持使用mkfifo命令创建命名管道(named pipe),即有名称的管道,它也称为FIFO,它可以协调任意进程间的数据通信。

例如,创建命名管道文件a.fifo,a.fifo就是这个命名管道的名称。虽然它以文件的方式存在于磁盘上,但它传递数据的方式不会经过磁盘IO,而是直接在内存中传递,所以速度非常快,文件名仅仅只是这个命名管道的名称而已,是引用这个管道的入口和出口。

$ mkfifo a.fifo
$ ls -l a.fifo
prw-r--r-- 1 root root 0 Apr 30 23:52 a.fifo  # 文件类型为p

命名管道是阻塞式的双向通信管道,任意一方都可以读、写,但是只有读、写端同时打开了命名管道时,数据才会写入并被读取。例如,下图中显示了在未打开读端命名管道的时候,所有写命名管道的操作都被阻塞。如果cat a.fifo按下回车键打开读端命名管道,写和读操作都将正常执行。同理,只打开读端而未打开写端命名管道时,读操作也会被阻塞。

套接字

套接字(Socket)用于协调不同计算机上的进程间通信,也就是基于网络的通信。当然,也可以在本机上使用套接字进行进程间的通信。

套接字通信的方式非常多,有Unix域套接字、TCP套接字、UDP套接字、链路层套接字等等。但最常用的肯定是TCP套接字。所以,这里介绍下TCP Socket通信方式,稍后再单独介绍Unix域套接字。

TCP Socket用于客户端、服务端的基于TCP协议的通信,所以在客户端和服务端均需要创建一个套接字。创建TCP套接字时会返回这个套接字的文件描述符,可通过这个文件描述符对套接字进行读和写操作。

对比一下,当一个程序需要对一个磁盘文件同时进行读写操作(在命令行下似乎没有找到这种命令,但通过编程方式是很容易实现的)时,由于只通过单个文件描述符同时负责读和写,很可能需要通过不断移动文件指针的方式来改变读写的位置,否则数据很容易错乱。

而TCP套接字也是通过单个文件描述符进行读写套接字的,为了保证读和写的位置不错乱,操作系统在内核空间为每个TCP套接字维护了两个buffer空间,一个buffer用于写、一个buffer用于读。提供读的buffer空间称为recv buffer,提供写的buffer空间称为send buffer,它们统称为socket buffer。

所以,服务端和客户端通过两个套接字通信就简单了,一端向send buffer写数据,该buffer的数据会通过已经建立好的TCP连接发送到另一端的recv buffer,于是另一端只需从recv buffer中读数据即可实现不同计算机上的进程间通信。过程如图。

Unix域套接字

Unix域套接字是套接字的一种,用于本机进程间通信,一般用来实现双向通信的管道。Unix域套接字是比网络套接字轻量级且高效的多,因为它不涉及网络通信,不需要监听连接,不需要绑定地址,不需要关心协议类型,等等。

创建Unix域套接字后返回两个文件描述符,这两个文件描述符均对套接字可读、可写,从而实现全双工的双向通信。

同样的,为了避免使用单个文件描述符同时读、写造成的数据错乱,Unix域套接字也有两个buffer空间。

内核资料直通车:Linux内核源码技术学习路线+视频教程代码资料

学习直通车:Linux内核源码/内存调优/文件系统/进程管理/设备驱动/网络协议栈

原文作者:极致Linux内核

原文地址:Linux内核:进程管理——管道、套接字 - 知乎(版权归原文作者所有,侵权留言联系删除)

猜你喜欢

转载自blog.csdn.net/m0_74282605/article/details/130134631