转载 关于bufferedInputStream的理解

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:http://blog.csdn.net/m0_37133375/article/details/95685751

如有侵权,请练习我删除

1分钟理解io、缓冲io原理

基础知识

文件的读写,是以页为单位的,页的大小通常为4kb。程序读取文件时,会执行一次read系统调用,由用户态转换为内核态,然后从磁盘读取一页数据放到内核缓冲区,接着数据从内核缓冲区复制到用户缓冲区,此时read系统调用返回,由内核态切换回用户态。(不理解这几个关键字的可以自行百度)

文件的读取过程

假设系统一页大小为4kb,要读取的文件有10kb。

FileInputStream用read()第一次读取文件时,进行一次系统调用,由用户态切换到内核态,从文件中读取4kb存储到内核缓冲区,读取一个字节后切换到用户态;接着继续读取,每读一个字节,进行一次系统调用,经过两次上下文切换。当内核缓冲区数据不足时,从文件中读取并填充。
整个过程经历了:
复制文件数据到内核缓冲区3次,
内核缓冲区复制到用户缓冲区102410次,
系统调用次数1024
10(其他的系统调用,比如打开文件、关闭文件等不计入次数),
上下文切换1024102,
read()次数1024*10。

BufferedOutputStream用read()第一次读取文件时,进行一次系统调用,由用户态切换到内核态,从文件中读取4kb存储到内核缓冲区。因为BufferedOutputStream默认的缓冲区大小为8kb,把内核缓冲区的4kb复制到BufferedOutputStream的缓冲区时,发现BufferedOutputStream的缓冲区没有填满,这个时候,会再次从磁盘读取4kb到内核缓冲区,然后再将内核缓冲区中的数据复制到BufferedOutputStream的缓冲区时。此时,BufferedOutputStream缓冲区填满,第一次系统调用结束。切回用户态后,从BufferedOutputStream的缓冲区读取一个字节。至此,第一次read()调用结束。
接着继续read时,不用进行系统调用,直接从BufferedOutputStream的缓冲区读取。
当BufferedOutputStream的缓冲区数据读完时,会再次切换到内核态,将剩余的2kb填充到内核缓冲区,然后将内核缓冲区中的2kb复制到BufferedOutputStream的缓冲区,
此时,BufferedOutputStream的缓冲区没有填满,因为文件已经读完了,接着切回用户态,读取数据,直至读取完毕。
整个过程经历了:
复制文件数据到内核缓冲区3次,
内核缓冲区复制到用户缓冲区3次,
系统调用次数2次(其他的系统调用,比如打开文件、关闭文件等不计入次数),
上下文切换4次,
read()次数1024*10。

可以看到:BufferedOutputStream的系统调用次数与上下文切换次数明显降低很多。

性能优化

FileInputStream可以适当调大字节数组。
BufferedOutputStream适当调大字节数组或者缓冲区大小。

其他

FileInputStream没有缓冲区。
FileInputStream的read(byte[] b)跟read()差不多,只是一次读取了多个字节,BufferedOutputStream的read(byte[]b)跟read()也差不多。
如果保持BufferedOutputStream的缓冲区大小不变,BufferedOutputStream和FileInputStream的字节数组大小保持一直,逐渐调整字节数组大小,可以发现FileInputStream的性能逐渐接近BufferedOutputStream。

猜你喜欢

转载自blog.csdn.net/silk_java/article/details/108751611