Linux/Unix 文件描述符(File Describer)的本质

Linux/Unix(以下简称Linux)系统中，每个进程都有一个专用的数组，数组的元素是一个结构体，称为文件描述符File Descriptor(以下简称fd)，但是至少包含一个文件指针，指向Linux内核的Open File Table(以下简称Open表)，Open表也可以理解一个数组，使用偏移量来指示每个元素的位置，上述fd的文件指针指向的就是这里说的偏移位置。Open表的元素称为File Description(以下简称FD，注意描述的差异)，每个FD都有一个INODE指针，指向文件系统的INODE Table。文件系统的INODE Table(以下简称INODE表)，每个元素也是个结构类型，包括了文件在磁盘中的具体位置、所有者、写入时间等的信息，文件驱动器通过INODE表来实际操作文件。具体如下图：
在这里插入图片描述
创建fd的方式：

系统调用，比如使用socket()的函数进行操作
从父进程中继承，线程A使用fork()函数生成线程B，那么B就有了自己的fd，不过指向的是相同的FD。
注意：如果在复制的时候，对某些fd使用了CLOSE_ONEXEC标记，那么子进程的这些fd就失效了，但是不影响父进程的fd使用

销毁fd的方式：

close()系统调用
进程结束

关于INODE，前面提到INODE也是一个结构类型，但是它仍然不会存储数据的磁盘数据，它存储的是文件的信息。文件系统是软硬件的结合处，该系统通过INODE的信息查找文件。Linux中的每一个文件(Linux一切皆文件)都对应一个INODE实体，每个系统有一个INODE上限。

理解epoll底层原理（非具体实现）

创建`epoll()`：

#include <sys/epoll.h>
int epoll_create(int size);

size指定大小epoll将要创建事件队列的容量，不过该参数在内核2.6.8之后就废弃了，由系统自动化分配。
函数返回epoll在进程中的fd。

#include <sys/epoll.h>
int epoll_create1(int flags);

flags=0功能同上，另一个选项是EPOLL_CLOEXEC。这个选项的作用是当父进程fork出一个子进程的时候，子进程不会包含epoll的fd

在`epoll`上注册事件

int epoll_ctl(int epfd, int op, int fd, struct epoll_event* event);

epfd是创建的epoll的fd
op表示操作的类型
- EPOLL_CTL_ADD ：注册事件
- EPOLL_CTL_MOD：更改事件
- EPOLL_CTL_DEL：删除事件
fd是相应的文件描述符
event是事件队列

typedef union epoll_data {
	void *ptr;
	int fd;
	uint32_t u32;
	uint64_t u64;
} epoll_data_t;

struct epoll_event {
	uint32_t events;
	epoll_data_t data;
};

事件是一些宏定义，可以查表，data是共用体，ptr表示内核中OPEN表的指针，fd表示

`epoll_wait`等待事件发生

int epoll_wait(int epfd, struct epoll_event* evlist, int maxevents, int timeout);

epfd是epoll的文件描述符
evlist是发生的事件队列
maxevents是队列最长的长度
timeout是事件限制

错误返回-1，超时返回0，成功返回事件的个数。

基本流程

以下是基本的流程，但不是真正的内存模型。一个epoll有一个注册事件的fd的列表，列表中发生事件的fd会被存储在epoll_wait函数的队列中。
在这里插入图片描述

`epoll`的陷阱与内部的原理

给出一个典型的陷阱，借用之前的图片：
在这里插入图片描述

A线程fd0指向一个系统资源，A线程的fd3是复制的fd0的。A线程fork出B线程，但是fd3复制的时候标记为close-on-exec，那么复制后的fd3就不能再表示之前的资源了。同时还可以看出，FD是进程间共享的，如果任意一个进程更改了FD，那么其它进程的fd对应的FD也会发生更改，这在多进程模型中是需要注意的。

`epoll`的内部基本机制（不含实现）

在这里插入图片描述
fd0和fd1是两个已经开启的文件描述符，而且指向不同的INODE。之后系统调用epoll_create创建新的INODE实体(等效在内核中创建一个FD实体)，之后调用该函数的线程会获取一个fd，假设是fd9，那么此时fd9和进程A任然共享同一个Interest List，此时A也会响应fd9的事件。假设B进程又添加了fd8，那么A也会响应fd8.

深入理解Linux/Unix文件描述符和epoll

Linux/Unix 文件描述符(File Describer)的本质

理解epoll底层原理（非具体实现）

创建`epoll()`：

在`epoll`上注册事件

`epoll_wait`等待事件发生

基本流程

`epoll`的陷阱与内部的原理

`epoll`的内部基本机制（不含实现）

参考资料

猜你喜欢

深入理解Linux/Unix文件描述符和epoll

Linux/Unix 文件描述符(File Describer)的本质

理解epoll底层原理（非具体实现）

创建epoll()：

在epoll上注册事件

epoll_wait等待事件发生

基本流程

epoll的陷阱与内部的原理

epoll的内部基本机制（不含实现）

参考资料

猜你喜欢

创建`epoll()`：

在`epoll`上注册事件

`epoll_wait`等待事件发生

`epoll`的陷阱与内部的原理

`epoll`的内部基本机制（不含实现）