数据库设计的三范式与反三范式

范式(数据库设计范式,数据库的设计范式)是符合某一种级别的关系模式的集合。构造数据库必须遵循一定的规则。在关系数据库中,这种规则就是范式。关系数据库中的关系必须满足一定的要求,即满足不同的范式。

一、第一范式

在任何一个关系数据库中,第一范式(1NF)是对关系模式的基本要求,不满足第一范式(1NF)的数据库就不是关系数据库。

所谓第一范式(1NF)是指数据库[表]的每一列都是不可分割的基本数据项,同一列中不能有多个值,即[实体]中的某个属性不能有多个值或者不能有重复的属性。

例如一个字段NAME保存了“李白,字太白”,这样就不符合第一范式,因为存储了多个值,可改为两个字段,分别保存李白和太白。

二、第二范式

在满足第一范式的基础上,不允许部分依赖。

所谓部分依赖,指的是当主键由两个以上的字段组成的时候。其他非主属性不能仅仅依赖主键的一部分。比如学号课程分数姓名这四个字段。我们把(学号课程)组合起来作为主键,可以发现,分数是依赖于全部主键的,而姓名仅仅依赖于学号,和课程没有半毛钱关系,这就叫部分依赖。

不满足第二范式会存在一些问题:

  • 数据冗余:每条记录都含有相同信息;

  • 删除异常:删除所有学生成绩,就把课程信息全删除了;

  • 插入异常:学生未选课,无法记录进数据库;

  • 更新异常:调整课程学分,所有行都调整。

    扫描二维码关注公众号,回复: 8594844 查看本文章

    如果按照第二范式设计,可以拆分成
    学生表:student(学号, 姓名);
    课程表:course(课程号, 学分);
    选课关系表:student_course(学号, 课程号, 成绩)。

三、第三范式

在满足第二范式的基础上,不能存在依赖传递。

比如一张表有学号姓名课程号课程名称,这几个字段。课程号依赖于学号,而课程名称依赖于课程号。所以课程名称传递依赖于学号

可能会存在问题:

  • 数据冗余:有重复值;
  • 更新异常:有重复的冗余信息,修改时需要同时修改多条记录,否则会出现数据不一致的情况 。

如果按照第三范式进行设计,可以拆分成

学生表:student(学号, 姓名, 课程号);

课程表:course(课程号, 课程名称)。

四、反三范式

在进行数据库设计时,不能古板的一味迎合范式。不难看出,范式的等级越高,拆分的表就越多,查询操作也就越复杂,查询的效率也会受到影响。所以在有些时候适当降低范式标准,增加一些冗余字段,虽然会增加一些空间占用,以及对冗余数据的维护工作,但带来的效率的提升是很值得的。

猜你喜欢

转载自www.cnblogs.com/hanstrovsky/p/12192057.html