基础知识

文件的读写，是以页为单位的，页的大小通常为4kb。程序读取文件时，会执行一次read系统调用，由用户态转换为内核态，然后从磁盘读取一页数据放到内核缓冲区，接着数据从内核缓冲区复制到用户缓冲区，此时read系统调用返回，由内核态切换回用户态。（不理解这几个关键字的可以自行百度）

文件的读取过程

假设系统一页大小为4kb,要读取的文件有10kb。

FileInputStream用read()第一次读取文件时，进行一次系统调用，由用户态切换到内核态，从文件中读取4kb存储到内核缓冲区，读取一个字节后切换到用户态；接着继续读取，每读一个字节，进行一次系统调用，经过两次上下文切换。当内核缓冲区数据不足时，从文件中读取并填充。
整个过程经历了：
复制文件数据到内核缓冲区3次，
内核缓冲区复制到用户缓冲区102410次，
系统调用次数102410（其他的系统调用，比如打开文件、关闭文件等不计入次数），
上下文切换1024102，
read()次数1024*10。

BufferedOutputStream用read()第一次读取文件时，进行一次系统调用，由用户态切换到内核态，从文件中读取4kb存储到内核缓冲区。因为BufferedOutputStream默认的缓冲区大小为8kb，把内核缓冲区的4kb复制到BufferedOutputStream的缓冲区时，发现BufferedOutputStream的缓冲区没有填满，这个时候，会再次从磁盘读取4kb到内核缓冲区，然后再将内核缓冲区中的数据复制到BufferedOutputStream的缓冲区时。此时，BufferedOutputStream缓冲区填满，第一次系统调用结束。切回用户态后，从BufferedOutputStream的缓冲区读取一个字节。至此，第一次read()调用结束。
接着继续read时，不用进行系统调用，直接从BufferedOutputStream的缓冲区读取。
当BufferedOutputStream的缓冲区数据读完时，会再次切换到内核态，将剩余的2kb填充到内核缓冲区，然后将内核缓冲区中的2kb复制到BufferedOutputStream的缓冲区，
此时，BufferedOutputStream的缓冲区没有填满，因为文件已经读完了，接着切回用户态，读取数据，直至读取完毕。
整个过程经历了：
复制文件数据到内核缓冲区3次，
内核缓冲区复制到用户缓冲区3次，
系统调用次数2次（其他的系统调用，比如打开文件、关闭文件等不计入次数），
上下文切换4次，
read()次数1024*10。

可以看到：BufferedOutputStream的系统调用次数与上下文切换次数明显降低很多。

性能优化

FileInputStream可以适当调大字节数组。
BufferedOutputStream适当调大字节数组或者缓冲区大小。

其他

FileInputStream没有缓冲区。
FileInputStream的read(byte[] b)跟read()差不多，只是一次读取了多个字节，BufferedOutputStream的read(byte[]b)跟read()也差不多。
如果保持BufferedOutputStream的缓冲区大小不变，BufferedOutputStream和FileInputStream的字节数组大小保持一直，逐渐调整字节数组大小，可以发现FileInputStream的性能逐渐接近BufferedOutputStream。

转载关于bufferedInputStream的理解

1分钟理解io、缓冲io原理

基础知识

文件的读取过程

性能优化

其他

猜你喜欢

转载 关于bufferedInputStream的理解

1分钟理解io、缓冲io原理

基础知识

文件的读取过程

性能优化

其他

猜你喜欢

转载关于bufferedInputStream的理解