DBS概论(二)

DBS概论(二)

二、数据模型

数据模型分为两类

(1)概念模型,也成信息模型

按用户的观点来对数据和信息的建模,用于数据库设计

(2)逻辑模型和物理模型

  • 逻辑模型主要包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等
  • 物理模型是对数据最底层的抽象

在这里插入图片描述

PS: 数据模型的三大组成要素:

  • 数据结构–描述系统的静态特性

    刻画数据模型性质的重要方面,描述数据库的组成对象(对象的类型、内容、性质),描述对象之间的关系

  • 数据操作–描述系统的动态特性

    对数据库中各种对象得到实例允执行的操作的集合,包括操作(增删改【更新】、查)和相关的操作规则。

    操作语言:SQL、DDL、DML

  • 数据的完整性约束

    一组完整性规则的集合

1、概念模型(Conceptual Model)

概念模型实际上是现实世界到机器世界的一个中间层次。概念模型用于信息世界的建模,是现实世界到信息世界的一层抽象,是数据库设计人员进行数据库设计的有力工具,也是数据库设计人员和用户进行交流的语言

2、层次模型(Hierarchical Model)

定义

树型(层次)结构表示实体类型及实体间联系的数据模型称为层次模型。

特点(优点)

(1)数据结构简单

​ 只需要几条命令就能操纵数据库,比较容易使用。

(2)结构清晰,结点间联系简单

​ 只要知道每个结点的双亲结点,就可以知道整个模型结构。现实世界中许多实体间联系本来就是呈现出一种很自然的层次关系,如表示行政层次,家族关系很关系。

(3)有良好的完整性支持

(4)层次数据库查询效率高。

​ 因为层次模型中记录之间的联系用有向边表示,这种联系在DBMS中常常用指针来实现。因此这种联系也就是记录之间的存取路径。当要存取某个结点的记录指,DBMS就沿着这一条路径很快找到该记录值,所以层次数据库的性能优于关系数据库, 不低于网状数据库。

优缺点

优点:

​ 以上特点即为层次模型的优缺点

缺点:

​ (1)现实世界中很多联系是非层次性的,如多对多联系、一个结点具有多个双亲等。层次模型表示这类联系的方法很不灵活,不能直接表示两个以上的实体型间的的复杂的联系和实体型间的多对多联系。只能通过引入冗余数据或建非自然的数据组织如创建虚拟节点的方法来解决,易产生不一致性。

​ (2)对数据的插入和删除的操作限制太多。

​ (3)查询子女结点必须通过双亲结点,因为层次模型对任一结点的所有子树都规定了先后次序,这一限制隐含了对数据库存取路径的控制。树中父子结点之间只存在一种联系,因此,对树中的任一结点,只有一条自根结点到达它的路径。

​ (4)树结点中任何记录的属性只能是不可再分的简单数据类型。

​ (5)由于结构严密,层次命令趋于程序化。

3、网状模型

定义

有向图结构表示实体类型及实体间联系的数据结构模型称为网状模型。

特点

(1)允许有一个以上的节点无双亲。

(2)至少有一个节点可以有多于一个的双亲。

优缺点

优点:

​ (1) 能够更为直接地描述现实客观世界。可表示实体间的多种复杂联系。

​ (2) 具有良好的性能,存取效率较高。

缺点:

​ (1) 结构比较复杂,其数据定义语言(DDL)、数据操作语言(DML)复杂,用户不容易使用。而且应用环境越大,数据库的结构就变得越复杂,不利于最终用户掌握。

​ (2) 数据独立性差,由于实体间的联系本质上是通过存取路径表示的,因此应用程序在访问数据时要指定存取路径。

4、关系模型(重点)

定义

​ 关系模型是指用二维表的形式表示实体和实体间联系的数据模型。

​ 关系数据模型是以集合论中的关系概念为基础发展起来的。关系模型中无论是实体还是实体间的联系均由单一的关系来表示。在实际的关系数据库中的关系也称表。一个关系数据库就是由若干个表组成。

基本的术语

(1)关系(Relation):

​ 一个关系对应着一个二维表,二维表就是关系名。

(2)元组(Tuple):

​ 在二维表中的一行,称为一个元组。
(3)属性(Attribute):

​ 在二维表中的列,称为属性。属性的个数称为关系的元或度。列的值称为属性值;

(4)(值)域(Domain):

​ 属性值的取值范围为值域。

(5)分量:

​ 每一行对应的列的属性值,即元组中的一个属性值。

(6)关系模式:

​ 在二维表中的行定义,即对关系的描述称为关系模式。一般表示为(属性1,属性2,…,属性n),如老师的关系模型可以表示为教师(教师号,姓名,性别,年龄,职称,所在系)。

(7)键(码):

​ 如果在一个关系中存在唯一标识一个实体的一个属性或属性集称为实体的键,即使得在该关系的任何一个关系状态中的两个元组,在该属性上的值的组合都不同。

(8)候选键(候选码):

​ 若关系中的某一属性的值能唯一标识一个元组如果在关系的一个键中不能移去任何一个属性,否则它就不是这个关系的键,则称这个被指定的候选键为该关系的候选键或者候选码。

(9)主键(主码):

​ 在一个关系的若干候选键中指定一个用来唯一标识该关系的元组,则称这个被指定的候选键称为主关键字,或简称为主键、关键字、主码。每一个关系都有并且只有一主键,通常用较小的属性组合作为主键。

​ 例如学生表,选定“学号”作为数据操作的依据,则“学号”为主键。而在选课表中,主键为(学号,课程号)。

(10)主属性和非主属性:

​ 关系中包含在任何一个候选键中的属性称为主属性,不包含在任何一个候选键中的属性为非主属性。

(11)全键或者全码:

​ 一个关系模式中的所有属性的集合。

(12)外键或者外码:

​ 关系中的某个属性虽然不是这个关系的主键,或者只是主键的,但它却是另外一个关系的主键时,则称之为外键或者外码。

(13)超键或者超码:

​ 如果在关系的一个键中移去某个属性,它仍然是这个关系的键,则称这样的键为关系的超键或者超码。

(14)参照关系与被参照关系:

​ 是指以外键相互联系的两个关系,可以相互转化。

关系模式

关系模式是对关系的描述。

R(U,D,dom,F)

​ R : 关系名

​ U: 组成该关系的属性名集合

​ D : 属性组U中属性所来自的域

​ dom: 属性向域的映象集合

​ F : 属性间的数据依赖关系集合。

关系模式通常可以简记为:

R (U) 或 R (A1,A2,…,An)

R 关系名,A1,A2,…,An 属性名,注:域名及属性向域的映象常常直接说明为属性的类型、长度。

关系数据库系统是支持关系模型的数据库系统。

特点

  • 概念单一
  • 规范化
  • 以二维表格表示

优缺点

(1) 数据结构单一

关系模型中,不管是实体还是实体之间的联系,都用关系来表示,而关系都对应一张二维数据表,数据结构简单、清晰。

(2)关系规范化,并建立在严格的理论基础上

构成关系的基本规范要求关系中每个属性不可再分割,同时关系建立在具有坚实的理论基础的严格数学概念基础上。

(3)概念简单,操作方便

关系模型最大的优点就是简单,用户容易理解和掌握,一个关系就是一张二维表格,用户只需用简单的查询语言就能对数据库进行操作。

发布了12 篇原创文章 · 获赞 16 · 访问量 525

猜你喜欢

转载自blog.csdn.net/weixin_45914074/article/details/104672721