《数据库系统概论》基本概念篇(第5版 王珊 萨师煊 编著)

一、数据库的4个基本概念

1、数据(data)

数据是数据库中存储的对象。描述事物的符号记录称为数据。数据和关于数据的解释是不可分的。数据的解释是指对数据含义的说明,数据的含义称为数据的语义,数据与其语义是不可分的。

2、数据库(DataBase,DB)

数据库是长期存储在计算机内、有组织、可共享的大量数据的集合。数据库中的数据按一定的数据模型组织、描述、存储,具有较小的冗余度、较高的数据独立性和易扩展性,并可为各种用户共享。
数据库数据具有永久存储、有组织和可共享三个基本特点

3、数据库管理系统(DataBase Management System,DBMS)

数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性和安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复。

数据库管理系统是位于用户和操作系统之间的一层数据管理软件。用于科学的组织和存储数据,高效的获取和维护数据。主要功能:

  1. 数据定义功能(数据定义语言,DDL)
  2. 数据组织、存储和管理
  3. 数据操纵功能(数据操纵语言,DML)
  4. 数据库的事务管理和运行管理
  5. 数据库的建立和维护
  6. 其他功能

4、数据库系统(DataBase System,DBS)
数据库系统是由数据库、数据库管理系统、应用程序和数据库管理员(DataBase Administrator,DBA)组成的存储、管理、处理和维护数据的系统。

二、数据库系统的特点

1、数据结构化

数据库系统实现整体数据的结构化,这是数据库的主要特征之一,也是数据库系统与文件系统的本质区别。
在文件系统中,文件中的记录内部有结构,但记录的结构和记录之间的联系被固化在程序中,由程序员维护。
数据不再仅仅面对某一个应用,而是面向整个系统,不仅数据内部是结构化的,而且整体是结构化的,数据之间是具有联系的

2、数据的共享性高、冗余度低且易扩充

数据面向整个系统。数据共享可以大大减少数据冗余,节约存储空间,还能避免数据间的不相容性与不一致性。这使数据库系统弹性大,易于扩充。

3、数据独立性高

数据独立性包括物理独立性和逻辑独立性。

  1. 物理独立性是指用户的应用程序和数据库中数据的物理存储是相互独立的。
  2. 逻辑独立性是指用户的应用程序和数据库的逻辑结构是相互独立的。

4、数据由数据库管理系统统一管理和控制
数据库的共享会带来数据库的安全隐患,而且共享是并发的(多用户同时存取数据)。数据库中数据的正确和一致要得到保障。为此,数据库管理系统要提供数据控制功能:
(1)数据的安全性保护,指保护数据以防止不合法使用造成的数据泄密和破坏。
(2)数据的完整性检测, 指数据的正确性、有效性和相容性。
(3)并发控制,对多用户的并发操作加以控制和协调。
(4)数据库恢复,从错误状态恢复到某一已知的正确状态。

三、数据模型

数据模型应满足三方面要求:一是能比较真实地模拟现实世界,二是容易被人理解,三是便于在计算机上实现。

数据模型通常由数据结构、数据操作和数据的完整性约束条件组成。

第一类是概念模型,第二类是逻辑模型和物理模型

概念模型也叫信息模型,按用户的观点对数据和信息建模,主要用于数据库设计。
逻辑模型包括层次模型、网状模型、关系模型、面向对象模型等,按计算机系统的观点对数据建模,主要用于数据库管理系统的实现。
物理模型是对数据最底层的抽象,描述数据在系统内部的表示方法和存取方法,或在磁盘上的存储方法和存取方法,面向计算机系统。

先将现实世界抽象为信息世界,再将信息世界转换为机器世界。

四、概念模型

1、信息世界基本概念
(1)实体(entity),客观存在并可相互区别的事物称为实体。
(2)属性(attribute),实体所具有的某一特性称为属性。
(3)码(key),唯一标识实体的属性集称为码。
(4)实体型(entity type),用实体名及其属性名集合来抽象和刻画同类实体,称为实体型。如,学生(学号,姓名,性别)就是一个实体型。
(5)实体机(entity set),同一类型实体的集合称为实体集。如,全体学生。
(6)联系(relationship),实体之间的联系。一对一,一对多等。

2、概念模型的表示方法:实体-联系方法(E-R)
实体-联系方法(Entity-Relationship approach),E-R方法也叫E-R模型。
E-R图(E-R diagram)。
approach 有靠近和方法的意思。
diagram 图,图表,图解的意思。

E-R图:
(1)实体用矩形表示
(2)属性用椭圆表示
(3)联系或者叫关系用菱形表示
(4)一对一、一对多、多对多关系用 1、a-z(一般是m,n)表示,其中多对多时字母要不一样

五、关系模型

1、关系模型的数据结构
(1)关系(relation):一个关系对应一张表。
(2)元组(tuple):表中的一行为一个元组。
(3)属性(attribute):表中的一列为一个属性。
(4)码(key):表中唯一确定一个元组的一个属性组
(5)域(domain):属性的取值范围,数据类型要相同。
(6)分量:元组中的一个属性值。
(7)关系模式:对关系的描述,一般为 关系名(属性1,属性2,…)

关系的每一个分量必须是一个不可分的数据项。

R(D1,D2,…,Dn)
目或度(degree):属性的个数,当n=1时,称该关系为单元关系,往后是二元关系。
候选码(candidate key):某一属性组能唯一标识一个元组,而其子集不能的一个属性组。
主码(primary key):多个候选码中选一个作为主码。
主属性(prime attribute):候选码的属性叫主属性。
全码(all-key):关系模式的所有属性都是候选码的情况。

2、关系模型的数据操纵和完整性约束

关系模型的数据操纵主要包括查询、插入、删除和更新数据,这些操作必须满足完整性约束条件。
关系的完整性约束条件包括:实体完整性、参照完整性和用户定义的完整性。

  1. 实体完整性规则:主属性不能取空值(null value)。
  2. 参照完整性:外码属性要么取空值,要么等于某个元组的主码值。
  3. 用户定义的完整性:用户定义的一系列约束条件。

3、关系模型优缺点
(1)关系模型建立在严格的数学概念上的。
(2)关系模型概念单一,数据结构简单、清晰、用户易懂易用。
(3)关系模型的存取路径对用户透明,数据独立性更高,安全保密性更好,简化程序员工作和数据库开发建立的工作。

六、数据库系统的三级模式结构与二级映像

1、模式(schema)

模式也称逻辑模式,是数据库全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图。
数据库数据在逻辑上的视图,一个数据库只有一个模式

2、外模式(external schema)

外模式也称子模式或用户模式,局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一个应用有关的数据的逻辑表示。(对应于某一应用)。
外模式通常是模式的子集,一个数据库可以有多个外模式,但一个程序只能使用一个外模式

3、内模式(internal schema)

内模式也称存储模式,它是数据物理结构和存储方式的描述,是数据在数据库内部的组织方式。
一个数据库只有一个内模式

1、外模式/模式映像

模式描述的是数据的全局逻辑结构,外模式描述的是数据的局部逻辑结构。
外模式/模式映像保证了数据与程序的逻辑独立性,简称数据的逻辑独立性。

2、模式/内模式映像

保证了数据与程序的物理独立性,简称数据的物理独立性。

本篇结束,关系代数暂时不讲,下一篇是关系数据库标准语言SQL

猜你喜欢

转载自blog.csdn.net/qq_44829047/article/details/107227843