【创作赢红包】数据库第一章:基础概念

学习数据库,最重要的首先是基础概念,其次就是实战了,这里我们先来复习一些基础概念。


一、理解数据库的基本概念

四个基本概念
数据(DATA):数据库中存储的基本对象,是描述事物的符号记录,数据与其语义是不可分的。
数据库(DATABASE,DB):是长期存储在计算机内、有组织的、可共享的大量数据集合。

数据库特征:

  • 数据按一定的数据模型组织、描述和存储。
  • 可为各种用户共享
  • 冗余度较小
  • 数据独立性较高
  • 易拓展

数据库管理系统(DBMS):是位于用户与操作系统之间的一层数据管理软件。

数据课管理系统的主要功能有;

  • 数据定义功能:提供数据定义语言(DDL)定义数据库中的数据对象
  • 数据操纵功能:提供数据操纵语言(Data Manipulate Language, DML) ,实现对数据库的基本操作(查询、插入、删除和修改)。
  • 数据库的运行管理:保证数据的安全性、完整性、多用户对数据的并发使用、发生故障后的系统恢复。
  • 数据库的建立和维护功能(实用程序):数据库数据批量装载、数据库转储、介质故障恢复、数据库的重组织、性能监视等。

数据库系统(Database System,DBS):是指在计算机系统中引入数据库后的系统,在不引起混淆的情况下常把数据库系统简称为数据库。

数据库系统由数据库、数据库管理系统(及其开发工具)、应用系统、数据库管理员和用户构成。

二、了解数据管理技术的发展

数据管理技术的产生和发展:数据管理指对数据进行分类、组织、编码、存储、检索和维护,是数据处理的中心问题。在应用需求的推动下,在计算机硬件、软件发展的基础上,它经历了人工管理、文件系统、数据库系统三个阶段。

人工管理阶段(40年代中–50年代中):产生的背景是:应用需求为科学计算;硬件水平为无直接存取存储设备;软件水平为没有操作系统;处理方式为批处理。特点是:

  • 数据的管理者:应用程序,数据不保存。> - 数据面向的对象:某一应用程序。
  • 数据的共享程度:无共享、冗余度极大。
  • 数据的独立性:不独立,完全依赖于程序。
  • 数据的结构化:无结构。
  • 数据控制能力:应用程序自己控制。

在这里插入图片描述
文件系统阶段(50年代末–60年代中):产生的背景:应用需求为科学计算、管理;硬件水平为出现磁盘、磁鼓;软件水平为有文件系统;处理方式为联机实时处理、批处理。特点是:

  • 数据的管理者:文件系统,数据可长期保存。
  • 数据面向的对象:某一应用程序。
  • 数据的共享程度:共享性差、冗余度大。
  • 数据的结构化:记录内有结构,整体无结构。
  • 数据的独立性差:数据的逻辑结构改变必须修改应用程序。
  • 数据控制能力:应用程序自己控制。

在这里插入图片描述
数据库系统阶段(60年代末以来):产生的背景:应用需求为大规模管理;硬件水平为出现大容量磁盘;软件水平为出现数据库管理系统;处理方式为联机实时处理、分布处理和批处理。
在这里插入图片描述

三、掌握数据库系统的特点

数据的结构化:这是数据库与文件系统的根本区别。在文件系统中,相互独立的文件的记录内部是有结构的,最简单的形式是等长记录,这种结构是面向某一具体应用的,缺乏灵活性;而数据库系统实现了整体的结构化,数据不再面向某一应用,而是面向全组织,不仅数据具有结构,而且存取数据的方式非常灵活,可以存取数据库中的某一个数据项、一组数据项、一个记录或一组记录,而在文件系统中,数据的最小存取单位是记录,粒度不能细到数据项。
数据的共享性高,冗余度低,易扩充:数据库系统从整体角度看待和描述数据,数据不再面向某个应用而是面向整个系统,数据可以被多个用户、多个应用共享使用。数据共享可以大大减少数据冗余,节约存储空间,避免数据之间的不相容性与不一致性,使数据库系统的弹性大,易于扩充,可以适应各种用户的需求。
数据的独立性高:数据的独立性包括数据的物理独立性和逻辑独立性。前者是指用户的应用程序与存储在磁盘上的数据库中数据是相互独立的,当数据的物理存储改变了,应用程序不用改变;后者是指用户的应用程序与数据库的逻辑结构是相互独立的,数据的逻辑结构改变了,用户程序也可以不变。

数据由DBMS统一管理和控制。DBMS提供以下控制功能
数据的安全性(Security):保护数据以防止不合法的使用造成的数据的泄密和破坏,使每个用户只能按指定方式操纵数据。
数据的完整性(Integrity):将数据控制在有效的范围内,或保证数据之间满足一定的关系。
并发(Concurrency)控制:对多用户的并发操作加以控制和协调,防止相互干扰而得到错误的结果。
数据库恢复(Recovery):将数据库从错误状态恢复到某一已知的正确状态。

四、理解数据模型的基本概念

在数据库中用数据模型这个工具来抽象、表示和处理现实世界中的数据和信息,通俗地讲数据模型就是现实世界的模拟。数据模型应满足三方面要求 : (1) 能比较真实地模拟现实世界、(2)容易为人所理解、(3)便于在计算机上实现。

数据模型的分类:
概念模型(也称信息模型)是按用户的观点来对数据和信息建模(用于数据库设计);
数据模型是按计算机系统的观点对数据建模,主要包括网状模型、层次模型、关系模型等(用于DBMS的设计)

客观对象的抽象过程

  • 现实世界中的客观对象抽象为概念模型。
  • 把概念模型转换为某一DBMS支持的数据模型。
  • 概念模型是现实世界到机器世界的一个中间层次。

数据模型的组成要素
数据结构:所研究对象类型的集合,对象包括两类:一类是与数据类型、内容、性质有关的对象,另一类是与数据之间联系有关的对象。数据结构是对系统静态特性的描述。
数据操作:对数据库中各种对象(型)的实例(值)允许执行的操作及有关的操作规则。常用的数据操作类型有:检索、更新(包括插入、删除、修改)。数据模型必须定义各操作的确切含义、操作符号、操作规则(如优先级)、实现操作的语言。数据操作是对系统动态特性的描述。
数据的约束条件:一组完整性规则的集合。完整性规则是给定数据模型中数据及其联系所具有的制约和储存规则,用以限定符合数据模型的数据库状态以及状态变化,以保证数据的正确、有效、相容。数据约束条件反映和规定本数据模型必须遵守的基本的通用的完整性约束条件。例如在关系模型中,任何关系必须满足实体完整性和参照完整性两个条件。

概念模型:用于信息世界的建模,是现实世界到机器世界的一个中间层次,是数据库设计的有力工具,是数据库设计人员和用户之间进行交流的语言。概念模型一方面应该具有较强的语义表达能力,能够方便、直接地表达应用中的各种语义知识,另一方面它还应简单、清晰、易于用户理解。
信息世界中的基本概念
实体(Entity):客观存在并可相互区别的事物称为实体。
属性(Attribute):实体所具有的某一特性称为属性,一个实体可以由若干个属性来刻画。如学生可由学号、姓名,性别、系别、入学时间等属性来描述。
码(Key):能唯一标识实体的属性集称为码。
域(Domain):属性的取值范围称为该属性的域。
实体型(Entity Type):用实体名及其属性集来抽象和刻画,同类实体称为实体型。如:学生(学号,姓名,性别,出生年….)
实体集(Entity Set):同型实体的集合称为实体集。
联系(Relationship):现实世界中事物内部以及事物之间的联系在信息世界中反映为实体内部的联系和实体之间的联系。

两个实体型间的一对一联系 :若对于实体集A中的每个实体,实体集B中至多有一个实体与之联系,反之亦然,则称实体集A与实体集B具有一对一联系,记为1:1。如班级与班长间的联系是一个班级只有一个班长、一个班长只在一个班中任职。
两个实体型间的一对多联系:若对于实体集A中的每个实体,实体集B中有n (n≥0)个实体与之联系,对于实体集B中的每个实体,实体集A中至多只有一个实体与之联系,则称实体集A与实体集B有一对多联系,记为1:n。如班级与学生之间的联系是一个班级中有若干学生、每个学生只在一个班级中学习
两个实体型间的多对多联系:若对于实体集A中的每个实体,实体集B中有n (n≥0)个实体与之联系,对于实体集B中的每个实体,实体集A中也有m (m≥0)个实体与之联系,则称实体集A与实体B具有多对多联系,记为m:n。如课程与学生之间的联系是一门课程同时有若干个学生选修、一个学生可以同时选修多门课程。

多个实体型间的一对一联系
多个实体型间的一对多联系:若实体集E1,E2,…,En存在联系,对于实体集Ej(j=1,2,…,i-1,i+1,…,n)中的给定实体,最多只和Ei中的一个实体相联系,则Ei与E1,E2,…,Ei-1,Ei+1,…,En间的联系是一对多的。如一门课程可以有若干个教师讲授,使用若干本参考书,每一个教师只讲授一门课程,每一本参考书只供一门课程使用,则课程与教师、参考书间的联系是一对多的。
多个实体型间的多对多联系

同一实体集内各实体间的一对一联系
同一实体集内各实体间的一对多联系:如职工实体集内部具有领导与被领导的联系:某一职工(干部)领导若干名职工、一个职工仅被另外一个职工直接领导,这是一对多的联系。
同一实体集内各实体间的多对多联系

在这里插入图片描述

在这里插入图片描述

五、掌握最常用的数据模型

最常用数据模型
层次模型(Hierarchical Model)
网状模型(Network Model)
关系模型(Relational Model)
面向对象模型(Object Oriented Model)
其中层次模型和网状模型统称为非关系模型,它们的数据结构是以基本层次联系为基本单位,基本层次联系是两个记录及其一对多的联系;关系模型的数据结构是表;面向对象模型的数据结构是对象。

层次模型

数据结构:满足下面两个条件的基本层次联系的集合为层次模型:有且只有一个结点没有双亲结点,这个结点称为根结点;根以外的其它结点有且只有一个双亲结点。
多对多联系在层次模型中的表示:利用冗余结点或虚拟结点将多对多联系分解成一对多联系。
数据操纵与完整性约束:数据操纵包括查询、插入、删除、更新;完整性约束包括无相应的双亲结点值就不能插入子女结点值;如果删除双亲结点值,则相应的子女结点值也被同时删除;更新操作时,应更新所有相应记录,以保证数据的一致性
存储结构
邻接法或者链接法

优点:
层次数据模型简单,对具有一对多的层次关系的部门描述自然、直观,容易理解。
性能优于关系模型,不低于网状模型。
层次数据模型提供了良好的完整性支持。
缺点:
多对多联系表示不自然。
对插入和删除操作的限制多。
查询子女结点必须通过双亲结点。
层次命令趋于程序化。

网状模型
数据结构:满足下面两个条件的基本层次联系集合为网状模型
允许一个以上的结点无双亲。
一个结点可以有多于一个的双亲。
数据操纵与完整性约束:数据操纵包括查询、插入、删除、更新,但网状模型对数据操纵加了一些限制,提供了一定的完整性约束。
支持记录码的概念,码是唯一标识记录的数据项的集合。
双亲结点与子女结点之间是一对多联系。
支持双亲记录和子女记录之间某些约束条件,如允许插入尚未确定双亲结点值的子女结点值,允许只删除双亲结点值。
存储结构:使用单向链接、双向链接、环状链接、向首链接等链接法实现记录之间的联系。

优点
能更为直接地描述现实世界,如一个结点可以有多个双亲。
具有良好的性能,存取效率较高。
缺点
结构比较复杂,而且随着应用环境的扩大,数据库的结构就变得越来越复杂,不利于最终用户掌握。
DDL、DML语言复杂,用户不容易使用。因记录之间联系是通过存取路径实现的,应用程序在访问数据时必须选择适当的存取路径,故用户须了解系统结构的细节,加重了编程的负担。

关系模型

数据结构:逻辑结构是一张二维表,由行和列组成。

关系模型的一些术语:
关系(Relation):一个关系对应一张二维表。
元组(Tuple):表中的一行即为一个元组。
属性(Attribute):表中的一列即为一个属性,每一属性都有一个属性名。
主码(Key):表中的某个属性组,它可以唯一确定一个元组。
域(Domain):属性的取值范围。
分量:元组中的一个属性值。
关系模式:对关系的描述,一般形式为关系名(属性1,属性2,…,属性n)。如学生(学号,姓名,年龄,性别,系别,年级)。相当于概念模型中的实体型
关系模型中实体及实体间的联系都是用关系来表示的,如学生、课程、学生与课程间的多对多联系在关系模型中表示如下:
学生(学号,姓名,年龄,性别,系别,年级)
课程(课程号,课程名,学分) 选修(学号,课程号,成绩)

存储结构:表以文件形式存储。

优点:
建立在严格的数学概念的基础上;概念单一,实体和联系都用关系表示,数据操作结果为关系;存取路径对用户透明
缺点
存取路径对用户透明导致查询效率往往不如非关系数据模型。为提高性能,必须对用户的查询请求进行优化,增加了开发数据库管理系统的难度。

六、掌握数据库系统的三级模式结构

从数据库管理系统角度看数据库系统内部的模式结构(三级模式)。从数据库最终用户角度看数据库系统外部的体系结构(集中式,分布式,C/S)。
数据库系统模式的概念
型(Type):对某一类数据的结构和属性的说明。
值(Value):是型的一个具体赋值。
模式(schema):是数据库系统中全体数据的逻辑结构和特征的描述,是型。
例如:学生记录
记录型:(学号,姓名,性别,系别,年龄,籍贯)
该记录型的一个记录值:(210201,李明,男,计算机,22,江苏)
在这里插入图片描述

模式(Schema):也称逻辑模式,是数据库中全体数据的逻辑结构和特征的描述,是所有用户的公共数据视图,综合了所有用户的需求,一个数据库只有一个模式。模式是数据库系统模式结构的中间层,与数据的物理存储细节和硬件环境无关,与具体的应用程序、开发工具及高级程序设计语言无关。
外模式(External Schema)也称子模式或用户模式,是数据库用户使用的局部数据的逻辑结构和特征的描述,是数据库用户的数据视图,是与某一应用有关的数据的逻辑表示。外模式通常是模式的子集,一个数据库可以有多个外模式。同一外模式可以为某一用户的多个应用系统所使用,但一个应用程序只能使用一个外模式。外模式是保证数据库安全性的一个有力措施,每个用户只能看见和访问所对应的外模式中的数据。
内模式(Internal Schema):也称存储模式,是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式,一个数据库只有一个内模式。

七、掌握数据库系统的二级映像功能

数据库的二级映象功能与数据独立性:三级模式是对数据的三个抽象级别,二级映象是在DBMS内部实现这三个抽象层次的联系和转换。
外模式/模式映象:定义了外模式与模式之间的对应关系,每一个外模式都对应一个外模式/模式映象,该映象定义通常包含在各自外模式的描述中。
外模式/模式映象保证了数据的逻辑独立性:当模式改变时,数据库管理员修改有关外模式/模式映象,使外模式保持不变;应用程序是依据数据的外模式编写的,从而应用程序不必修改,保证了数据与程序的逻辑独立性,简称数据的逻辑独立性
模式/内模式映象:定义了数据全局逻辑结构与存储结构之间的对应关系,如说明逻辑记录和字段在内部是如何表示的。数据库中模式/内模式映象是唯一的,该映象定义通常包含在模式描述中。
模式/内模式映象保证了数据的物理独立性:当数据库的存储结构改变了(例如选用了另一种存储结构),数据库管理员修改模式/内模式映象,使模式保持不变,应用程序不受影响,保证了数据与程序的物理独立性,简称数据的物理独立性

八、理解数据库系统的组成

硬件平台及数据库:数据库系统对硬件资源的要求:
足够大的内存存放操作系统、DBMS的核心模块、数据缓冲区和应用程序,足够大的外存存放数据库及其备份。
较高的通道能力,提高数据传送率。
软件:包括DBMS、操作系统、与数据库接口的高级语言及其编译系统、以DBMS为核心的应用开发工具、为特定应用环境开发的数据库应用系统。
人员
数据库管理员(DBA):决定数据库中的信息内容和结构、决定数据库的存储结构和存取策略、定义数据的安全性要求和完整性约束条件、监控数据库的使用和运行、数据库的改进和重组、数据库重构。
系统分析员:负责应用系统的需求分析和规范说明、与用户及DBA协商,确定系统硬软件配置、参与数据库系统的概要设计。
数据库设计人员:参加用户需求调查和系统分析、确定数据库中的数据、设计数据库各级模式。
应用程序员:设计和编写应用系统程序模块、进行调试和安装。
用户
偶然用户:企业或组织机构的高中级管理人员。
简单用户:银行的职员、机票预定人员、旅馆总台服务员。
复杂用户:工程师、科学家、经济学家、科技工作者等,直接使用数据库语言访问数据库,甚至能够基于数据库管理系统的API编制自己的应用程序。

九、了解数据库技术的研究领域

数据库管理系统软件的研制:包括研制DBMS本身及以DBMS为核心的一组相互联系的软件系统(包括工具软件和中间件)。
数据库设计:包括数据库设计方法、设计工具、设计理论、数据模型和数据建模。
数据库理论:集中于关系的规范化理论、关系数据理论等。

猜你喜欢

转载自blog.csdn.net/weixin_62529383/article/details/129892316