数据库基础之存储结构

       数据存储结构是指数据库中的物理数据和逻辑数据的表示形式、物理数据和逻辑数据之间关系映射方式的描述。在数据库技术中,可以使用两种形式描述客观现实的数据:物理数据描述和逻辑数据描述。物理数据和逻辑数据之间的转换通过数据库管理系统实现。

1. 物理数据描述

       物理数据描述是指数据在存储设备上的存储方式,物理数据是实际存放在存储设备上的数据,这些数据也称为物理记录。根据物理记录存储的位置情况,又可以分为有序存储和无序存储。

在物理数据描述中,使用的数据描述术语包括以下各项。

       (1) 位(bit):二进制的一个单位称为位,位上只能取1或0。

       (2) 字节(byte):8个位称为一个字节,可以存放对应ASCII码的一个字符。

       (3) 字(word):若干个字节组成一个字。一个字所含的二进制的位数称为字长,许多计算机的字长是不同的,例如计算机的字长可以是8位、16位、24位、32位等。

       (4) 块(block):内存储器和外存储器交换信息的最小单位,又称为物理块或物理记录,每块的大小通常为256字节、512字节、1024字节等。

       (5) 卷(volume):一台输入输出设备所能装载的全部有用信息,例如磁带机的一盘磁带即为一卷,磁盘设备的一个盘组也是一卷。

       (6) 无序存储(unordered):数据记录的存储位置按照插入的顺序进行存储。

       (7) 有序存储(ordered):数据记录的存储位置按照指定的方式进行排序。

2. 逻辑数据描述

       逻辑数据描述是指用户或程序员用于操作的数据形式,逻辑数据是一种抽象的概念,是对客观现实世界的反映和记录,这些数据也可以称为逻辑记录。逻辑数据包含两个层次,一个层次是对客观现实信息世界的描述,另一个层次是对数据库管理系统中数据的描述。在对客观现实信息世界的描述中,使用的术语包括以下几项。

       (1) 实体(entity):客观现实存在的东西使用实体来描述。实体既可以是具体的、有形的对象,也可以是抽象的、无形的对象,例如,一本书是一个有形对象,一次借书过程则是一个无形的对象。

       (2) 实体集(entities):特性完全相同的同类实体的集合称为实体集。例如,一个图书馆所有的书籍是一个实体集,该图书馆的所有借书过程也是一个实体集。

       (3) 属性(attribute):实体的特性称为属性。每个属性都有一个值域,这些值域可以是整数类型、浮点数类型、字符类型或日期类型等。例如,实体书的属性包括书名、书号、出版日期、页数、价格以及出版社等,这些属性对应的值域分别为字符类型、字符类型、日期类型、整数类型、浮点数类型和字符类型等。

       (4) 标识符(identifier):能够唯一地标识每个实体的属性或属性集。例如,书的书号属性是实体书的标识符,借书过程实体的标识符包括借书证号、书号两个属性。

       这些逻辑数据最终要通过数据库管理系统来转换成物理数据,在数据库管理系统中描述逻辑数据的术语包括哪些呢?下面以关系型数据库管理系统为例进行介绍。

       (1) 数据项(data item):也称为字段(field),标记实体属性的可以命名的最小信息单位,数据项的命名一般采用属性的描述性名称。这些名称可以是中文、英文或汉语拼音。

       (2) 元组(tuple):也称为记录(record),数据项的集合称为元组。一个元组表示一个具体的实体。

       (3) 关系(relation):在关系型数据库系统中,同一类元组所在的集合称为关系。关系适用于描述实体集,它包括了一个实体集的所有元组。例如,所有的图书可以组成一个books关系。

       (4) 键码(key):在关系型数据库系统中,能够唯一地标识关系中每个元组的数据项或数据项集的称为关系的键码。

       逻辑数据和物理数据术语的对应关系如图5-4所示。在该图中,客观实体(图书)经过两层逻辑数据的描述,最后转变成实际存储的物理数据。

猜你喜欢

转载自hnulanwei.iteye.com/blog/2314038