前言

上篇Linux文章，我们学习了打开文件，读写文件等的操作。这些都是针对被打开的文件。
而文件还有没有打开的状态，也就是磁盘文件。本篇博客就将会针对磁盘文件，学习其相关知识。

在这里插入图片描述

文章目录

前言
一. 磁盘文件
二. 文件系统
结束语

一. 磁盘文件

我们先思考：

磁盘文件如何合理存储?

如何定位一个文件？

如何对磁盘文件进行读取和写入?

1. 磁盘的物理结构

磁盘是计算机上唯一的一个机械设备，同时也是外设

我们先了解磁盘的物理结构，这样，在后续的抽象中我们才能有更好的理解
在这里插入图片描述

盘片
盘片是多个摞在一起的，形成一层一层的盘面
盘片是类似光碟一样的东西，我们可以抽象理解为，磁盘表面有一个又一个的小磁铁，当我们向磁盘写入数据时：磁性N -> S；删除磁盘数据：磁性S -> N

磁头
磁头为了读取数据，同样也是多个一起的，一面对应一个磁头，一个磁头负责一面的读取
因为磁头也是一层一层分布的，并固定在一起，所以磁头的摆动是共进退的

盘片和磁头是没有挨着的。如果挨着，那么在两者的高速转动时，就可能产热过多，导致盘片表面的磁性因高温而被破坏，进而数据丢失。但二者的距离依然很近

2. 物理层面的读写

接下来，我们尝试在物理层面了解数据在磁盘上的读和写

首先，我们先了解盘片的结构
在这里插入图片描述

扇面：
盘片是一个圆形结构，通过角度可以将盘片均匀分割，而每一块就是一块扇面

扇区
再通过从外到内，不同半径又可以分成不同区块，这些区块就是扇区。
扇区是磁盘存储的基本单元。一个扇区有512个字节，或者4kb数据。一般磁盘，所有扇区都是512字节。

磁道
同一个半径都一圈区域是磁道，一个磁道上有半径相同的扇区

接下来，我们了解物理结构上数据的读写

在这里插入图片描述

扫描二维码关注公众号，回复： 15052617 查看本文章

数据的读写依靠的都是磁头，马达带动传动轴，传动手臂，利用磁头在盘片上读写。
每一面盘面，每一个磁道，每一个扇区都有其相应的编号。我们可以通过这些编号，驱动磁头读取数据。
首先，我们要先确定数据在哪个盘面，也就是确定哪个磁头读取 —> 磁头的编号；盘面的编号
其次，我们再定位在哪个磁道 --> 半径
最后，我们确定在该磁道的哪一个扇区 --> 扇区的编号
我们称这样的物理读取数据的方法是CHS定位法
磁头：head ；磁道(柱面)：cylinder；扇区：sector 取各个单词的首字母

3. 磁盘的逻辑抽象

在物理存储中，我们可以根据CHS定位法确定所需数据所在的扇区，但是磁盘毕竟是外设，而操作系统作为内设，是否也是根据CHS定位法读取数据呢？
答案是否定的。如果操作系统，也就是软件，同样依靠CHS定位法的话，那是不是意味着这是二者沟通的唯一途径呢？但是我们上述也提及到，一般的磁盘，扇区大小是512字节，但也有4kb的，这意味着不同磁盘存储数据其实不同，那CHS定位法就不能统一，磁盘可以不同，但是操作系统对待所有磁盘应该都是相同的，所以操作系统并不直接通过CHS定位法读取数据，而是使用自己的一套逻辑

在操作系统处理现实结构时，都是采用先描述，再组织的方式抽象数据类型，在磁盘这里同样使用了这一方式

在这里插入图片描述
现实生活中，我们用过磁带，这也是将数据以磁性存储的设备，磁带在机子里是圆状的，但是我们将带子一点点拉出来，他就可以被我们展开成线性结构。
而在操作系统中，同样是将磁盘上的一个个磁道，抽象成一个个数组，内部存储扇区

在这里插入图片描述

简单的将磁盘数据存储抽象化，使用数组下标模拟扇区的编号
但是一般一个扇区的大小是512字节，但是操作系统的读取是以4KB为单位进行IO的，所以换算过来，操作系统一次读取8个扇区。但是操作系统其实并不需要知道扇区的概念，他只把一次读取的4KB大小的数据，称为块。
计算机常规的访问方式：起始地址+偏移量
所以我们只需要知道数据块的起始地址（盘片的第一个扇区的下标地址）+4KB（块的类型），操作系统把块看作一种类型
所谓块的地址，本质就是数组的一个下标。
这种访问方式称为LAB --- logic adress block 逻辑块地址访问
操作系统通过读取块的方式，将要找的数据，传递给磁盘
OS -> N（数组下标） -> LAB -> 逻辑块地址
但是磁盘通过CHS定位法定位数据
所以LAB和CHS是需要互相转换的

二. 文件系统

之前我们所谈的文件系统并不完整，之前是针对打开的文件，而这次我们要学习的是文件系统对磁盘文件的管理。

我们使用的笔记本的存储可能会被分成2个盘，或者4个盘，我的就被分成了4个盘，分别是C，D，E，F。但这是Windows的图形化展示给我们看的，实际上我们的硬盘并没有被分成4块，其实还是完整的一块。只是通过规定界限，划分成了4个区域。
在这里插入图片描述
紧接着，我们知道操作系统的读取是4KB，而一个盘通常是100多GB，所以在此之下还有着划分

接下来，对于这个分组，我们就需要详细学习了

我们先看区的整体结构

Boot Block：启动块，大小为1kb，由pc标准规定的，用来存储磁盘分区信息和启动信息，任何文件系统都不能操作该块。
Block group：块组，详细如下

1. Block group

接下来，我们详细看块组的结构
在这里插入图片描述
文件=属性+内容
Linux是将属性和内容分开存储的，属性存储在inode Table，内容存储在Date blocks

一个文件的所有属性存放在inode节点中（128字节），一个文件，一个inode。属性包括但不限于，文件创建时间内，文件大小，文件类型，文件权限…

文件的内容是变化的，使用数据块存储文件内容，所以一个文件的内容可能由1个或多个块存储，一个块就是4KB，即使该文件内容只有1字节，仍然需要分配一个块 – 4KB存储。内容存储在Date blocks

SuperBlock：保存文件系统的所有属性信息，比如文件系统的类型（Linux是Ext），整个分组的情况（该分区有几个组，起始在哪，终止在哪，有多少被内存加载…）。

SuperBlock是统一更新的，每1个Block group中都有SuperBlock，group 0中为主，其他group为辅，主要是将SuperBlock进行备份，避免因为一点损害导致全局不可用。因为SuperBlock关乎与数据，所以需要备份。

Group Descriptor Table 组描述表：描述group内各个位置存储的信息，如Block Bitmap的起始位置和length等等。

inode table：保存group内所有文件的inode节点，每一个inode都有自己的inode编号，这个编号也属于文件的属性。
inode

Data blocks：存储当前group所有文件的内容。

一个inode对应一个文件，而该文件inode属性和该文件对应的数据块，有映射关系。inode内存储该文件内容所在数据块在Date blocks的下标（可多个）。

Block Bitmap位图 & inode Bitmap位图：每一个bit表示是否空闲，描述哪些data block或inode block是空闲或者被占用的。

2. 文件名和inode编号

Linux系统只认识inode编号，文件的inode属性中，并不存在文件名。
文件名是给用户看的

目录其实也是文件，拥有自己的inode，但其内容和普通文件有所不同
任何一个文件，一定在一个目录内部，目录的数据块里面保存的是，该目录下，文件名和文件inode编号的映射关系，而且在目录中，文件名和inode互为key值（可通过文件名找到inode，可通过inode找到文件名）。

3. 文件的读取

当我们访问一个文件的时候，我们是在特定目录下访问:cat log.txt

先要在当前目录下，通过文件名找到对应文件的inode编号

一个目录也是文件，一定隶属于一个分区，结合inode，在分区中找到分组，在分组中找到文件的inode。

再通过找到的inode，找到该文件的数据块Date blocks，并加载到OS，并完成显示器显示

4. 文件的删除

要删除文件，首先要找到该文件，查找的过程就和文件的读取一样，之后，文件的删除其实并不是将Date blocks里的数据清空，而是将Block Bitmap和inode Bitmap中该文件的位图置为0，下一次在该位置创建文件，写新文件时，可以直接进行覆盖。
当我们误删文件的时候，Linux下，我们可以在日志中找到删除文件的inode编号，我们以此就可以找到原文件的inode，再找到其inode Bitmap和Block Bitmap，将其置为1，这样创建新文件的时候，就不会在这个位置进行覆盖了，文件也恢复了。
Windows下，可以在回收站中找到，回收站类似日志，但是文件进入回收站，其实只是Linux下的mv，剪切移到回收站，清空回收站，才对应Linux下的rm。

5. inode映射关系

inode其实是一个结构体，我们上面说过，一个inode是128字节，存储相应的Date blocks的地址使用数组，但是128字节也存储不了几个地址，那这不就意味着inode存储的对应文件的大小并不大，但是实际上，一个文件大到，几百MB，GB。所以inode和Date blocks的映射关系到底是什么呢？

inode中存储Date block的地址确实是使用数组，但数组映射的Date block中可能并不是存储的文件的内容。
在这里插入图片描述

直接索引
存储的直接就是相应的内容的Date block，如图的1，2，3，4其内部直接是文件的内容

二级索引
inode中存储的地址对应的Date block内部不是文件的内容，而是其他Date block的下标，代表该文件由多个Date block存储内容
。这样文件的大小不就可以存储更多了吗

三级索引
同二级索引一样，但是inode对应的Date block存储的是二级索引的Date block，内部继续存储Date block的下标

6. 补充知识

inode编号，可以直接确定该inode在本区内的位置，不能跨分区。

分区，分组，Block group的内部结构，都是操作系统帮我们划分，管理的。在安装操作系统的时候，这些内容其实就已经在执行了。格式化，其实就是操作系统向分区写入文件系统的管理属性

存在数据块存满，inode没用完或者inode用完了，但是数据块没用完。
如果一直创建空文件，inode就可以被用完，但是数据块显然没用完
如果只创建少数文件，但一直往这几个文件内写内容，也存在数据块满了，但是inode没用完的情况。

目录也是文件，我们上面讲到，文件名并不是文件的属性，没有存储在inode结构体中，而是存储在目录中，但目录也是文件，那文件名和inode的映射关系到底在哪呢？
答案是，在操作系统眼中，目录和普通文件都是文件，目录的属性等也是存储在其inode结构体中，但目录的数据/内容，就是该目录下各文件名和inode的映射关系。详细我们在下篇博客 – 软硬链接，还会学习到

结束语

磁盘文件系统的学习大致就到这，读者可以结合博主前面的【Linux】文件操作和【Linux】重定向，这样就是一个完整的文件系统，包括操作系统如何打开/关闭，如何对文件做读写，重定向在文件操作角度是如何实现的。
如果觉得本篇文章对你有所帮助的话，不妨点个赞支持一下博主，拜托啦，这对我真的很重要。
在这里插入图片描述

【Linux】基础IO -- 磁盘文件系统

前言

文章目录

一. 磁盘文件

1. 磁盘的物理结构

2. 物理层面的读写

3. 磁盘的逻辑抽象

二. 文件系统

1. Block group

2. 文件名和inode编号

3. 文件的读取

4. 文件的删除

5. inode映射关系

6. 补充知识

结束语

猜你喜欢