从磁盘看 IO

计算机上的易失和非易失存储器

常见磁盘可以分为两类:机械磁盘和固态磁盘。

第一类,机械磁盘,也称为硬盘驱动器(Hard Disk Driver),通常缩写为 HDD。机械磁

盘主要由盘片和读写磁头组成,数据就存储在盘片的环状磁道中。在读写数据前,需要移

动读写磁头,定位到数据所在的磁道,然后才能访问数据。

显然,如果 I/O 请求刚好连续,那就不需要磁道寻址,自然可以获得最佳性能。这其实就

是我们熟悉的,连续 I/O 的工作原理。与之相对应的,当然就是随机 I/O,它需要不停地

移动磁头,来定位数据位置,所以读写速度就会比较慢。

第二类,固态磁盘(Solid State Disk),通常缩写为 SSD,由固态电子元器件组成。固

态磁盘不需要磁道寻址,所以,不管是连续 I/O,还是随机 I/O 的性能,都比机械磁盘要

好得多。

最小读写单位

机械磁盘的最小读写单位是扇区,一般大小为 512 字节。

而固态磁盘的最小读写单位是页,通常大小是 4KB、8KB 等。

文件系统会把连续的扇区或页,组成逻辑块,然后以逻辑块作为最小单元来管理数

据。常见的逻辑块的大小是 4KB,也就是说,连续 8 个扇区,或者单独的一个页,都可以

组成一个逻辑块

磁盘I/O原理

磁盘每个盘片为双面,每个面上分布一圈一圈的同心圆磁道,磁道由扇区组成。外围的扇区更宽,扇区的存储空间是一样的,一般每个扇区600字节,数据存储区512字节,其余存放控制信息。磁臂头移动遍历磁道,盘片旋转遍历扇区。
寻道时间:将磁臂头移动到指定磁道上所经历的时间
旋转延迟时间:盘片转动时扇区移动到磁头下所经历的时间
传输时间:将数据从磁盘读出或写入数据所经历的时间(与每次读/写的字节数和磁盘转速有关)

随机I/O:有一串随机数据文件(在磁盘上的位置分布随机的数据文件),需要从磁盘上一一读取。这样寻道时间很长,会导致I/O读取时间过长。
比如,在磁道2扇区3读取了第一个数据文件,接下来,磁头臂向外移动去磁道14扇区5读取第二个数据文件,接下来磁头臂又要向里移动到磁道8扇区4读取第三个数据文件,之前读取第二个数据文件时从磁道2移到14,现在又从磁道14移到8,可见这样重复走了8-14的磁道。可以知道,如果后面还有数据存在于走过的磁道上,会有很多的重复寻道,极大增加了寻道时间。

顺序I/O:就像是随机I/O的优化版,我们可以将我们要读取的数据文件按照其磁盘存放顺序排序,从第一个文件的位置开始向一个方向读取,我们依次读完每个磁道直到所有文件读取完,不必再有随机I/O带来的重复寻道时间。

在许多的开源框架如 Kafka、HBase 中,都通过追加写的方式来尽可能的将随机 I/O 转换为顺序 I/O,以此来降低寻址时间和旋转延时

什么是磁盘IO

IO就是    先从磁盘找到数据的位置,再将数据转换成数据流读到内存

               先从磁盘找到数据的位置,将内存中的数据转换成数据流写到磁盘

 IO消耗的时间(如下图)=磁盘访问时间=寻道时间+旋转延迟+传输时间


 

猜你喜欢

转载自blog.csdn.net/weixin_70280523/article/details/131474186