数据库物理存储

其他 2021-02-09 04:36:17 阅读次数: 0

一、计算机系统的存储体系

1.1 什么是存储体系

1.1.1 数据组织的基础--存储体系

将不同性价比的存储器组织在一起，满足高速度、大容量、低价格需求
CPU与内存直接交换信息，按存储单元(存储字)进行访问
外存按存储块进行访问，其信息需先装入内存，才能被CPU处理

1.2 不同层次存储的访问时间上的差异

1.3 操作系统如何管理磁盘和数据

操作系统对数据的组织：FAT-目录(文件夹)-磁盘块/簇
FAT(文件分配表-File Allocation Table)

1.4 操作系统对内存-缓冲区的管理

1.4.1 内存管理

一条记录的地址=存储单元的地址=内存地址=页面:页内偏移量
页面(Page)=块(Block)
内存页面的分配
内存页面的置换

二、磁盘的结构与特性

2.1 磁盘及磁盘的容量

盘面:磁道:扇区
磁盘读写单位：Sector $\rightarrow$ 簇Cluster/块Block：连续的若干个扇区

2.2 磁盘数据的访问

2.2.1 磁盘数据读写时间

寻道时间(约在1-20ms)
旋转时间(约0-10ms)
传输时间(每4KB页)

2.2.2 物理存取

降低了I/O次数
降低排序等待时间
降低寻道/旋转时间
- 同一磁道连续块存储
- 同一柱面不同磁道并行块存储
- 多个磁盘并行块存储

2.3 提高磁盘数据读写时间与存储可靠性的方法

RAID技术：Redundant Array of Independent Disk
- 并行处理：并行读取多个磁盘
- 可靠性：奇偶校验与纠错

三、DBMS数据存储与查询实现的基本思想

3.1 数据存储的映射关系示意图

3.2 数据存储与查询实现的基本框架示意

四、数据库之表-记录与磁盘块的映射

4.1 数据库概念与磁盘相关概念的映射示意

4.2 数据库中记录的区分及记录内属性值的区分

数据库记录在磁盘上的存储
- 定长记录，还是变长记录(靠分隔符区分开始与结束)

4.3 数据库中的记录vs磁盘块

记录是非跨块存储，还是块存储(靠指针连接)

数据库-表所占磁盘块的分配方法
- 连续分配：数据块被分配到连续的磁盘块上(会存在扩展困难问题)
- 链接分配：数据块中包含指向下一数据块的指针(访问速度问题)
- 按簇分配：按簇分配，簇是若干连续的磁盘块，簇之间靠指针连接；簇有时也称片段Segement或盘区extent
- 索引分配：索引块中存放指向世纪数据块的指针

五、数据库之文件组织方法

5.1 数据组织与存取方法

数据组织要考虑更新(增删改)和检索需求
- 更新将涉及数据存储空间的扩展与回收问题
- 检索将涉及扫描整个数据库的问题、大批量处理数据问题
- 不同的需求要求不同的数据组织方法和存取方法
- 文件组织指的是数据组织成记录、块和访问结构的方式，包括把记录和块存储在磁盘上的方式，以及记录和块之间相互联系的方法
- 存取方法指的是对文件所采取的存取操作方法
- 一种文件组织可以采取多种存取方法进行访问

5.2 无序文件组织

文件组织方法之一：无序记录文件(堆文件heap或pile file)
- 特点：记录可存储于任意有空间的位置，磁盘上的存储记录是无序的。更新效率高，但检索效率可能低
- 方法1：新纪录总是插入到文件尾部；删除记录时，可以直接删除改记录所在位置的内容，也可以在该记录前标"删除标记"
- 方法2：在前者基础上，新增记录可以利用那些标记为“删除标记”的记录空间
- 频繁删增记录时会造成空间浪费，所以需要周期性重新组织数据库
- 数据库重组是通过移走被删除记录使有效记录连续存放，从而回收那些由删除记录而产生的未利用空间

5.3 有序文件组织

文件组织方法之二：有序记录文件(排序文件Sequential)
- 特点：记录按某属性或属性组值的顺序插入，磁盘上存储的记录是有序的。检索效率可能高。
- 用于存储排序的属性通常称为排序字段(Ordering field)，通常，排序字段使用关系中的主码，所以又称排序码
- 当按排序字段进行检索时，速度得到很大提高；但当按非排序字段检索时，速度可能不会提高很多
- 有序记录文件的更新效率可能很低
- 因为：在更新时要移动其他记录，为插入记录留出空间
- 改进措施是可为将来有可能插入的元组预留空间(这可能造成空间浪费)，或者再使用一个临时的无序文件(被称为溢出文件)保留新增的记录。
- 当采取溢出文件措施时，检索操作既要操作主文件，又要操作溢出文件。
- 所以需要周期性重新组织数据库
- 数据库重组时间溢出文件合并到主文件中，并恢复主文件中红的记录顺序。

5.4 散列文件组织

文件组织方法之三：散列文件(Hash file)
- 特点：可以把记录按某属性或属性组的值，依据一个散列函数来计算其应存放的位置：桶号(Bucket，块号或簇号等)。检索效率和更新效率都有一定程度的提高
- 用于进行散列函数计算的属性通常称为散列字段，散列字段通常也采用关系中的主码，所以又称散列码
- 不同记录可能被hash成同一桶号，此时需在桶内顺序检索出其一记录
- 链接法处理溢出

5.5 聚簇文件组织

文件组织方法之四：聚簇文件组织
- 聚簇：将具有相同或相似属性值的记录存放于连续的磁盘簇块中
- 多表聚簇：将若干个相互关联的Table存储于一个文件中——这可提高多表情况下的查询速度

猜你喜欢

转载自blog.csdn.net/qq_38689352/article/details/111768715

数据库物理存储

数据库物理存储-数据库期末总结

存储物理页属性的PFN数据库

数据库底层物理存储层的管理方案

【手写数据库toadb】toadb物理存储模型，数据库物理存储原理，物理文件组织关系以及行列混合模型存储结构

sqlserver数据库的物理存储格式和逻辑存储格式

数据库物理设计

Oracle 数据库入门（四）物理存储结构之数据文件

mysql数据库文件的真实的物理存储位置

Oracle-Oracle数据库物理存储结构管理

postgresql查看数据库占用的物理存储空间大小

Oracle 数据库入门（五）物理存储结构之控制文件

数据库系统概论（二）数据库设计--数据库物理设计--存取结构、索引、聚簇、存储结构

oracle数据库的物理迁移

数据库物理分布设计

postgres 数据库物理备份与还原

数据库的逻辑结构与物理结构

XtraBackup数据库物理备份

数据存储（数据库）

Oracle 数据库入门（六）物理存储结构之重做日志文件和归档重做日志文件

数据库---存储过程

数据库-存储过程

数据库的存储引擎

数据库存储过程

数据库：存储程序

数据库: 存储过程

数据库——存储过程

数据库的存储过程

数据库—存储过程

数据库===》存储引擎

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)