目录
一、数据库系统概述
1.1数据库基本概念
1.1.1数据
数据是数据库中存储的基本对象
- 定义:描述事物的符号记录
- 种类:数字,文本,图形,图像,音频,视频,学生的档案记录等
- 数据的含义称为数据的语义,数据与其语义是不可分的
把某事物的多个属性组织在一起构成一个记录,记录是计算机中表示和存储数据的一种格式或一种方法
1.1.2数据库
定义:长期存储在计算机内、有组织的、可共享的大量数据的集合
基本特征:数据按一定的数据模型组织、描述和储存,可为各种用户共享,冗余度较小,数据独立性较高,易扩展
1.1.3数据库管理系统
定义:位于用户与操作系统之间的一层数据管理软件,是计算机的基础软件,是一个大型复杂的软件系统
用途:科学地组织和存储数据、高效地获取和维护数据
主要功能
- 数据定义功能
- 数据组织、存储和管理
- 数据操纵功能
- 数据库的事务管理和运行管理
- 数据库的建立和维护功能
1.1.4数据库系统
构成
- 数据库
- 数据库管理系统(及其应用开发工具)
- 应用程序
- 数据库管理员
数据库提供数据的存储功能
数据库管理系统提供数据的组织、存取、管理和维护等基础功能
数据库应用系统根据应用需求使用数据库
数据库管理员负责全面管理数据库系统
1.2数据库系统的特点
1.2.1数据结构化
数据的整体结构化是数据库的主要特征之一,也是数据库管理系统与文件系统的本质区别
整体结构化
- 不再仅仅针对某个应用,而是面向全组织
- 不仅数据内部是结构化的,整体也是结构化的,数据之间具有联系
- 数据记录可以变长
- 数据的最小存取单位是数据项
数据用数据模型描述,无需用程序定义
1.2.2数据的共享性高、冗余度低且易扩充
数据面向整个系统,可以被多个用户、多个应用共享使用
好处
- 减少数据冗余,节约存储空间
- 避免数据之间的不相容性与不一致性
- 使系统易于扩充
1.2.3数据独立性高
物理独立性:指用户的应用程序与数据库中数据的物理存储是相互独立的,当数据的物理存储改变了,应用程序不用改变
逻辑独立性:指用户的应用程序与数据库的逻辑结构是相互独立的,数据的逻辑结构改变了,应用程序不用改变
数据独立性由数据库管理系统的二级映像功能来保证
1.2.4数据由数据库管理系统统一管理和控制
1.数据的安全性保护:保护数据以防止不合法使用造成的数据泄密和破坏
2.数据的完整性检查:保证数据的正确性、有效性和相容性
3.并发控制:对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果
4.数据库恢复:将数据库从错误状态恢复到某一已知的正确状态
小结
- 数据库是长期存储在计算机内有组织的大量的共享的数据集合
- 可以供各种用户共享,具有最小冗余度和较高的数据独立性
- 数据库管理系统在数据库建立、运用和维护时对数据库进行统一控制,以保证数据的完整性、安全性,并在多用户同时使用数据库时进行并发控制,在发生故障后对数据库进行恢复
二、数据模型
数据模型是对现实世界数据特征的抽象(通俗地讲就是现实世界的模拟),是数据库系统的核心与基础
2.1两类数据模型
2.1.1数据模型的两个不同的层次
概念模型
也称信息模型,按用户的观点来对数据和信息建模,用于数据库设计
逻辑模型和物理模型
逻辑模型:按计算机系统的观点对数据建模,用于 DBMS实现(包括网状模型、层次模型、关系模型、面向对象数据模型、对象关系数据模型、半结构化数据模型等)
物理模型:对数据最底层的抽象,描述数据在系统内部的表示方法和存取方法,或在磁盘或磁带上的存储方式和存取方法
2.1.2客观对象的抽象过程---两步抽象
现实世界中的客观对象抽象为概念模型
- 将现实世界抽象为信息世界
把概念模型转换为某一数据库管理系统支持的数据模型
- 将信息世界转换为机器世界
2.2概念模型
概念模型用于信息世界的建模,是现实世界到机器世界的一个中间层次
2.2.1信息世界中的基本概念
1.实体
客观存在并可相互区别的事物称为实体
可以是具体的人、事、物或抽象的概念
2.属性
实体所具有的某一特性称为属性
一个实体可以由若干属性刻画
3.码
唯一标识实体的属性集称为码,例如学号是学生实体的码
4.实体型
用实体名及其属性名集合来抽象和刻画同类实体,例如:学生(学号,姓名,性别,出生年月)
5.实体集
同一类型实体的集合
6.联系
现实世界中事物内部以及事物之间的联系在信息世界中反映为实体(型)内部的联系和实体(型)之间的联系
- 实体内部的联系通常是指组成实体的各属性之间的联系
- 实体之间的联系通常是指不同实体集之间的联系。实体之间的联系有一对一、一对多和多对多等多种类型
2.2.2实体-联系方法
用E-R图描述现实世界的概念模型
E-R方法也称E-R模型
2.3数据模型的组成要素
数据模型通常由数据结构、数据操作和数据的完整性约束条件组成
2.3.1数据结构
描述数据库的组成对象以及对象之间的联系
描述内容
- 与对象的类型、内容、性质有关,例如网状模型中的数据项、记录,关系模型中的域、属性、关系等
- 与数据之间联系有关,例如网状模型中的系型
数据结构是对系统静态特性的描述
2.3.2数据操作
对数据库中各种对象(型)的实例(值)允许执行的操作的集合,包括操作及有关的操作规则
操作类型
- 查询
- 更新(包括插入、修改、删除)
数据操作是对系统动态特性的描述
2.3.3数据的完整性约束条件
1、数据的完整性约束条件
- 一组完整性规则的集合
- 完整性规则:给定的数据模型中数据及其联系所具有的制约和依存规则
- 用以限定符合数据模型的数据库状态以及状态的变化,以保证数据的正确、有效和相容
2、数据模型对完整性约束条件的定义
- 反映和规定必须遵守的基本的通用的完整性约束条件
- 提供定义完整性约束条件的机制,以反映具体应用所涉及的数据必须遵守的特定的语义约束条件
2.4常用数据模型
- 层次模型
- 网状模型
- 关系模型
- 面向对象数据模型
- 对象关系数据模型
- 半结构化数据模型
2.4.1层次模型
层次模型用树形结构来表示各类实体以及实体间的联系
满足下面两个条件的基本层次联系的集合为层次模型
- 有且只有一个结点没有双亲节点,这个节点称为根节点
- 根以外的其他节点有且只有一个双亲结点
特点
- 结点的双亲是唯一的
- 只能直接处理一对多的实体联系
- 每个记录类型可以定义一个排序字段,也称为码字段
- 任何记录值只有按其路径查看时,才能显出它的全部意义
- 没有一个子女记录值能够脱离双亲记录值而独立存在
2.4.2网状模型
网状数据库系统采用网状模型作为数据的组织方式
满足以下两个条件的基本层次联系集合称为网状模型
- 允许一个以上的结点无双亲
- 一个节点可以有多于一个的双亲
网状模型与层次模型的区别
- 网状模型允许多个结点没有双亲结点
- 网状模型允许结点有多个双亲结点
- 网状模型允许两个结点之间有多种联系(复合联系)
- 网状模型可以更直接地描述现实世界
- 层次模型实际上是网状模型的一个特例
2.4.3关系模型
详情请看数据库——关系数据库
三、数据库系统的结构
3.1数据库系统模式的概念
"型" 和 "值" 的概念
- 型:对某一类数据的结构和属性的说明
- 值:型的一个具体赋值
例如 学生记录(学号,姓名,性别,系别,年龄,籍贯)的一个记录值(201315130,李明,男,计算机系,19,江苏省南京市)
模式
- 数据库逻辑结构和特征的描述
- 是型的描述,不涉及具体值
- 反映的是数据的结构及其联系
- 模式是相对稳定的
实例
- 模式的一个具体值
- 反映数据库某一时刻的状态
- 同一个模式可以有很多实例
- 实例随数据库中的数据的更新而变动
3.2数据库系统的三级模式结构
3.2.1模式
也称逻辑模式
- 数据库中全体数据的逻辑结构和特征的描述
- 所有用户的公共数据视图
一个数据库只有一个模式
模式的地位:是数据库系统模式结构的中间层
模式的定义
- 数据的逻辑结构(数据项的名字、类型、取值范围等)
- 数据之间的联系
- 数据有关的安全性、完整性要求
数据库模式
- 即全局逻辑结构是数据库的中心与关键
- 独立于数据库的其他层次
- 设计数据库模式结构时应首先确定数据库的逻辑模式
3.2.2外模式
也称子模式或用户模式
- 数据库用户能够看见和使用的局部数据的逻辑结构和特征的描述
- 数据库用户的数据视图,是某一应用有关的数据的逻辑表示
外模式的地位:介于模式与应用之间
模式与外模式的关系:一对多
- 外模式通常是模式的子集
- 一个数据库可以有多个外模式。反映了不同的用户的应用需求、看待数据的方式、对数据保密的要求
- 对模式中同一数据,在外模式中的结构、类型、长度、保密级别等都可以不同
外模式与应用程序的关系:一对一
- 同一外模式也可以为某一用户的多个应用系统所使用
- 一个应用程序只能使用一个外模式
外模式的用途
- 保证数据库安全性的一个有力措施
- 每个用户只能看见和访问所对应的外模式中的数据
数据库的外模式
- 面向具体的应用程序
- 定义在逻辑模式之上
- 独立于存储模式和存储设备
- 当应用需求发生较大变化,相应外模式不能满足其视图要求时,该外模式就得做相应改动
- 设计外模式时应充分考虑到应用的扩充
3.2.3内模式
也称存储模式
- 是数据物理结构和存储方式的描述
- 是数据在数据库内部的表示方式
一个数据库只有一个内模式
数据库的内模式
- 依赖于它的全局逻辑结构
- 独立于数据库的用户视图,即外模式
- 独立于具体的存储设备
- 将全局逻辑结构中所定义的数据结构及其联系按照一定的物理存储策略进行组织,以达到较好的时间与空间效率
3.3数据库的二级映像功能与数据独立性
三级模式是对数据的三个抽象级别
二级映象在数据库管理系统内部实现这三个抽象层次的联系和转换
3.3.1外模式/模式映像
同一个模式可以有任意多个外模式
每一个外模式,数据库系统都有一个外模式/模式映象,定义外模式与模式之间的对应关系
映象定义通常包含在各自外模式的描述中
保证数据的逻辑独立性
- 当模式改变时,数据库管理员对外模式/模式映象作相应改变,使外模式保持不变
- 应用程序是依据数据的外模式编写的,应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性
3.3.2模式/内模式映像
模式/内模式映象定义了数据全局逻辑结构与存储结构之间的对应关系
数据库中模式/内模式映象是唯一的
映像定义通常包含在模式的描述中
保证数据的物理独立性
- 当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变
- 应用程序不受影响。保证了数据与程序的物理独立性,简称数据的物理独立性
by 云烟成雨yycy