一、学习目标
二、基本概念
数据库设计概述(生命周期)
-两个要求:信息管理要求,数据操作要求
-目标:为用户和各种应用系统提供一个信息基础设施和高效率的运行环境 所谓高效率是指“数据的存取效率高”“存储空间的利用率高”“管理的效率高”
-基本规律:三分技术、七分管理、十二分基础数据
-常用数据库设计方法(just学过的)
基于E-R模型的设计方法 3NF的设计方法
-基本步骤(重点)
-参与人员:系统分析员、数据库设计人员、应用开发人员、DBA、用户代表
需求分析
-设计数据库的起点是需求分析
-任务 看ppt
-方法:调查清楚用户的实际要求——>与用户达成共识——>分析与表达需求
-数据字典:数据字典是关于数据库中数据的描述,即元数据,不是数据本身
-数据项:数据项是不可再分的数据单位,是数据的最小组成单位
-数据结构:数据结构反映了数据之间的组合关系
-数据流:数据流是数据结构在系统内传输的路径
-数据存储:是数据结构停留或保存的地方,也是数据流的来源和去向之一
-处理过程:处理过程的具体处理逻辑一般用判定表或判定树来描述
概念结构设计(E-R图)
-是数据库设计的关键
-概念模型用E-R图来描述,具有四个特点
能真实、充分的反应显示世界,是现实世界的一个真实模型
易于理解,从而可以用它和不熟悉计算机的用户交换意见
易于更改,当应用环境和应用要求改变时,容易对概念模型修改和扩充
易于向关系、网状、层次等各种数据模型转化
--E-R模型(重点)
-基本表示
实体用矩形(别跟实体型混了)
属性用椭圆‘(别忘了联系也有可能又属性哦)
联系用菱形
-联系的度:就是参与联系的实体的个数
-单个实体间的关系:1:1、1:n、m:n
-两个实体间的关系
-多个实体间的关系:所有的实体都因为中间的关系联系在一起
-例子 某个工厂物资管理的概念模型
-概念结构设计过程
在画E-R图之前有两个问题
①如何确定实体和属性?以及实体之间的联系
②如何解决冲突?
答①:现实世界的事物能作为属性对待的,尽量作为属性对待。
①作为属性,不能再具有需要描述的性质 ②属性不能与其他实体具有联系
答②:这个问题主要是在E-R图集成的时候出现的,所以需要说比较多的东西
初步E-R图——>经过除去冗余——>基本E-R图
第一步:合并,在此过程中出现冲突
第二步:去除冗余
冗余的数据•是指可由基本数据导出的数据
冗余的联系•是指可由其他联系导出的联系
方法一就是分析法,根据数据字典靠眼瞅
方法二: 规范化理论
逻辑结构设计
任务就是把E-R图转成DBMS支持的数据模式相符的逻辑结构(E-R向数据模型的转换)
---E-R图向关系模型的转换
一个实体型转为一个关系模式
关系的属性:实体的属性
关系的码:实体的码
对于联系的话1:1可以、1:n联系
转换为独立的关系模式
该关系的属性:联系的属性+联系对象的码
该关系的候选码:每个实体的码
或者加入1端的关系模式
但是对于m:n联系,就只能转成一个独立的关系模式了
另外,具有相同码的关系模式可以合并
---数据模型的优化
---设计用户子模式
就是设计外模式——视图,视图更要注重考虑用户的习惯和方便:符合用户使用习惯的别名、不同级别的用户定义不同的视图,保证系统的安全性、简化用户对系统的使用
物理结构设计
即在物理设备上的存储结构和存取方法——依赖于具体的DBMS
步骤:确定一个数据库的物理结构——>对物理结构进行评价——>结果满足设计要求,则进行物理实施,不满足则回到第一步
---数据库物理设计的内容和方法
目标:在数据库上运行的各种事务响应时间小、存储空间利用率高、事务吞吐量率大
---关系模式存取方法选择
除了默认会建立索引的属性,还有什么样的属性配拥有索引?
经常在查询条件中出现、常作为最大值和最小值等聚集函数的参数、连接操作的连接条件
哈希表:等值连接多的属性会用到
聚簇:为了提高查询速度,把某个属性具有相同值的放在连续的物理块中,该属性为聚簇码
---确定数据库的存储结构
指确定数据的存放位置和存储结构,综合考虑存取时间、存储空间利用率和维护代价3个方面的因素
---评价物理结构
评价方法完全依赖于所选用的RDBMS
–数据库设计人员必须定量估算各种方案的存储空间、存取时间和维护代价,从中选择一个较优的、合理的物理结构
数据库的实施和维护
数据载入,应用程序的编码和调试
数据库试运行
数据库的运行和维护
1.数据库的转储和恢复
2.数据库的安全性、完整性控制
3.数据库性能的监督、分析和改造
4.数据库的重组织与重构造