对文件 I/O，标准 I/O 的缓冲的理解

1.标准I/O缓冲区

要理解标准I/O，就要先知道文件I/O的业务逻辑。

下面图示为文件I/O

如执行下面的代码：

write(fd, buf2, sizeof(buf2));

图中

buf：就是buf2。

缓冲区：是文件系统的页缓存。

当执行写操作时，buf中的数据会被复制到内核空间的页缓冲区，如果使用的是同步写，那么数据会从页缓冲写到磁盘，如果使用的是延迟写，那么数据不会立即写入磁盘，只有当页缓冲区满了，或者页缓冲区被其他I/O使用时，才会写入磁盘。

当执行读操作时，磁盘数据先被复制到页缓冲，进程再从页缓冲中取数据，当页缓冲空间大小大于用户要求读取的数据量时，文件系统会假设用户紧接着会读取后面连续的数据，所以会将随后的数据预先载入页缓冲，这样用户下次读时，就可以直接从页缓冲中读取。

标准I/O的不足就是 buf 的大小不一定等于页缓冲区的大小，当 buf 的大小小于页缓冲区的大小时，一次写后页缓冲区并没有被填满，便进行了一次磁盘访问。文件I/O对此进行了改进。

2.文件I/O缓冲区

文件I/O的图示如下：

我们知道文件I/O是对文件流对象进行操作的，FILE 中重要的数据结构就是：文件描述符、指向缓冲区的指针。

文件I/O多了一个缓冲区，该缓冲区由 malloc分配，在用户空间，并且它的大小和内核页缓冲区的大小匹配。

当执行全缓冲的写操作时，buf中的数据先复制到流缓冲区中，当流缓冲区填充满后，再复制到内核页缓冲区，然后访问磁盘，写入数据。

当执行读操作时，第一次读操作：数据从磁盘复制到页缓冲，再从页缓冲复制到流缓冲，进程从流缓冲中复制需要的数据，由于每个流都有自己的流缓冲，那么当页缓冲中数据被刷掉后，进程不需要调用read函数，而只需要读自己的流缓冲区中预先读取的数据。

文件I/O提高速率的方法就是：尽量让流缓冲区填满后，再将数据传送给内核的页缓冲区，这样每次访问磁盘，都可以最大效率的传送数据。

3.实验证明效率

用三种不同的函数，完成读文件后写到标准输出的工作。