数据库三范式理解

一范式就是属性不可分割。

属性是什么?就是表中的字段,不可分割的意思就按字面理解就是最小单位,不能再分成更小单位了。这个字段只能是一个值,不能被拆分成多个字段,否则的话,它就是可分割的,就不符合一范式。

不过能不能分割并没有绝对的答案,看需求,也就是看你的设计目标而定。

举例:学生信息组成学生信息表,有姓名、年龄、性别、学号等信息组成。姓名不可拆分吧?所以可以作为该表的一个字段。但我要说这个表要在国外使用呢?人家姓和名要分开,都有特别的意义,所以姓名字段是可拆分的,分为姓字段和名字段。简单来说,一范式是关系数据库的基础,但字段是否真的不可拆分,根据你的设计目标而定。

二范式就是要有主键,要求其他字段都依赖于主键。

为什么要有主键?没有主键就没有唯一性,没有唯一性在集合中就定位不到这行记录,所以要主键。

其他字段为什么要依赖于主键?因为不依赖于主键,就找不到他们。更重要的是,其他字段组成的这行记录和主键表示的是同一个东西,而主键是唯一的,它们只需要依赖于主键,也就成了唯一的。

如果不理解依赖这个词,可以勉强用“相关”这个词代替,也就是说其他字段必须和它们的主键相关。因为不相关的东西不应该放在一行记录里。举例:学生信息组成学生表,姓名可以做主键么?不能!因为同名的话,就不唯一了,所以需要学号这样的唯一编码才行。那么其他字段依赖于主键是什么意思?就是“张三”同学的年龄和性别等字段,不能存储别人的年龄性别,必须是他自己的,因为张三的学号信息就决定了,这行记录归张三所有,不能给无关人员使用。

三范式就是要消除传递依赖

方便理解,可以看做是“消除冗余”。消除冗余应该比较好理解一些,就是各种信息只在一个地方存储,不出现在多张表中。

比如说大学分了很多系(中文系、英语系、计算机系……),这个系别管理表信息有以下字段组成:系编号,系主任,系简介,系架构。那么再回到学生信息表,张三同学的年龄、性别、学号都有了,我能不能把他的系编号,系主任、系简介也一起存着?如果你问三范式,当然不行,因为三范式不同意。因为系编号,系主任、系简介已经存在系别管理表中,你再存入学生信息表,就是冗余了。三范式中说的传递依赖,就出现了。这个时候学生信息表中,系主任信息是不是依赖于系编号了?而这个表的主键可是学号啊!

所以按照三范式,处理这个问题的时候,学生表就只能增加一个系编号字段。这样既能根据系编号找到系别信息,又避免了冗余存储的问题。

范式的优点和缺点

  • 范式化的更新操作同上比反范式化要更快
  • 当数据很好的准守范式化,只有很少或者说没有重复数据,只需要修改很少的数据
  • 范式化的表通常很小,可以更好的存放在内存里,所以执行操作更快。

简单的来说,遵循范式化的表设计。通常表小,冗余少,更新快。但是冗余少也可能意味着遇到稍微复杂一些查询语句,需要关联多次。这样的代价不但昂贵,而且也可能会使一些索引策略失效。

完全的范式化和完全的反范式化都是不可取的,有时候我们对于某些字段适当的进行冗余操作来减少连表查询,也会带来不错的效果。

系列其他文章

用了这么久的MySQL,你了解MySQL的架构吗?

数据库事务的四大特性(ACID)

细说数据库隔离级别

MySQL究竟是如何做到持久性的?

我就执行一个count(*)为什么这么慢?

MySQL复制原理

MySQL的“order by”是如何对200G文件进行排序的?

要去面试阿里,你至少要掌握如下的索引知识。

如果你不了解InnoDB的存储逻辑,可能你并不是真正搞懂MySQL

 

猜你喜欢

转载自blog.csdn.net/qq_25448409/article/details/88403383