目录
根据《大话数据结构》、《小灰的算法之旅》、《数据结构》c语言版严蔚敏第二版 所做的笔记和总结
1.数据结构(Data structure)起源
早期人们发明计算机只是为了进行大量的计算,所以计算机解决问题是把具体的问题抽象为一个适合的数据模型,然后根据此数据模型设计一个算法,然后编写程序,得到一个实际的软件,可现实中,我们更多的不是解决数值计算的问题,而是需要一些更科学更有效的手段(比如表、树和图等数据结构)的帮助,才能更好解决问题。
所以数据结构是一门研究非数值计算的程序设计问题中的操作对象,以及它们之间的关系和操作等相关的学科。
我的理解就是:当我们把具体问题抽象为数据模型时,数据结构其实就是用来告诉我们怎样存储数据并存储数据之间关系和存储数据之间具体操作方式的一种工具。
1.1数据
数据:是描述客观事物的符号,是计算机可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。数据不仅仅包含整型、实型等数值类型,还包括字符及声音、图像、视频等非数值类型。
也就是说数据,其实就是符号,这些符号必须具备以下两个前提:
- 可以输入到计算机中
- 能被计算机程序处理
对于整型、实型等数值类型,可以进行数值计算。
对于字符数据类型,就需要进行非数值的处理。而声音、图像、视频等其实是可以通过编码等手段变成字符数据来处理的。
1.2数据元素
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理,也被称为记录。
比如:男人、女人、老人、小孩都属于人的数据元素。
比如:鸡、鸭、鱼、牛、马、羊都属于畜禽类的数据元素。
1.3数据项
数据项:一个数据元素由若干个数据项组成。数据项是数据不可分割的最小的单位。
比如:人这样的数据元素,可以有眼睛、嘴巴、鼻子、耳朵、手、脚这些数据项,也可以有姓名、性别、年龄、出生日期、家庭地址等数据项,具体选择哪些数据项,需要我们根据程序实现的功能来选择。
1.4数据对象
数据对象:是性质相同的数据元素的集合,是数据的子集。
什么是性质相同?性质相同就是指数据元素具有相同类型和数量的数据项。比如:人都有姓名、性别、年龄等相同的数据项。
1.5数据结构
结构,简单理解就是关系。在现实世界中,不同的数据元素之间不是独立的,它们或多或少都有一定的关系,我们把这种关系叫做结构。那什么是数据结构?
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。
在计算机中数据不是孤立的、杂乱无章的 ,它们或多或少都有一定的联系,它们是具有联系的数据元素,也就是数据的组织形式。
要写出一个“好”程序,必须分析待处理对象的特性及各处理对象之间存在的关系,这就是我们要学习数据结构这门课的意义。
定义中提到了一种或多种特定关系,具体是什么关系,这正是我们下面要讨论的逻辑结构和物理结构。
1.6逻辑结构和物理结构
1.6.1逻辑结构
逻辑结构:是指数据对象中数据元素之间的相互关系。
逻辑结构主要有以下四种结构:
1.集合结构
集合结构:集合结构中的数据元素除了在同一集合里,它们之间没有其他关系了。
2.线性结构
线性结构:线性结构中的数据元素之间是一对一的关系。
3.树形结构
树形结构:树形结构中的数据元素之间存在一对多的层次关系。
4.图形结构
图形结构: 图形结构的数据元素是多对多的关系。
我们在用示意图表示数据的逻辑结构时,要注意两点:
- 将每个元素看作一个结点,用圆圈表示。
- 元素之间的逻辑关系用结点之间的连线表示,如果这个关系是有方向的就用有箭头的连线表示。
逻辑结构就是针对具体的问题的,为了解决某些问题,在对问题的理解的基础上,选择一个合适的数据结构表示数据元素之间的逻辑关系。
我的理解:就是人们在解决各种复杂的问题的时候,把问题分析成若干数据元素,这些数据元素或多或少都具有特定的关系,所以我们要选择符合这些特定关系的一种逻辑关系来表示数据之间的关系到底是哪种关系。
1.6.2物理结构(存储结构)
物理结构(存储结构):是指数据的逻辑结构在计算机中的存储形式。
物理结构字面意思实际上就是如何把数据元素存储到计算机中的存储器中。一般计算机存储器主要是针对内存而言,例如硬盘,光盘,内存条,U盘等外部存储器(硬件)的数据组织通常通过文件结构来表示的。
数据的存储结构应该正确反应数据元素之间的逻辑关系,这才是最关键的。我们说的存储结构不是存储在什么硬件设备上,而是如何存储,是一种存储方式,如何存储数据元素之间关系的逻辑关系,这是实现物理结构的重点和难点。
物理结构有以下两种形式:
1.顺序存储结构
顺序存储结构:是把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
就像是排队占位置,每个人都占有一小段空间,大家谁也别想插队,就像是c语言中的数组,当你建立一个有9个整型的数组时,计算机就会在内存中找到一片空地,占的位置按照一个整型大小乘以9,开辟一段连续的空间来存储这九个整型数据,第一个数组数据就在第一个位置,第二个数组数据就在第二个位置,这样依次存储。如图所示:
2.链式存储结构
链式存储结构:是把数据元素存放在任意的存储单元里,这组存储单元是可以连续的也可以是不连续的。
排队的队伍中总有人会插队,也有人会去上厕所,还有人会放弃,所以现在银行、医院等地方设置了排队系统,也就是每个人去了先领一个号,等着叫号,叫到时就去办理业务或看病。在等待的时候你可以爱在哪在哪,只要叫到你时及时回来就好。这时你只需关注有没有叫到你的上一位,当叫到你的上一位时,下一个就轮到你了。
需要注意的是数据元素的存储关系并不能反映其逻辑关系,因此需要一个指针来存放数据元素的地址,这样就可以通过地址来找到相关联的数据元素的位置了。如图所示:
逻辑结构就是面向问题的,而物理结构就是面向计算机的,其基本的目标就是将数据及其逻辑关系存储到计算机的内存中。
1.7数据类型
数据类型:是指一组性质相同的值的集合及定义在此集合上的一些操作的总称。
1.7.1数据类型定义
数据类型是按照值的不同来进行划分的。在高级语言中,每个变量、常量和表达式都有各自的取值范围。类型就用来说明变量或表达式的取值范围和所能做的操作。
那些设计计算机语言的人是很聪明的,他们通过数据类型来对数据进行划分,能更大程度提高空间的利用率,对于不同的要求进行了更优化的操作。
在计算机中,内存不是无限大的(能省则省),当我们要进行一些运算时,如1+1=2、3+5=8这样的整型数字的加减乘除运算时,就不需要开辟很大的适合小数甚至字符运算的内存空间。于是计算机的研究者们就考虑,要对数据进行分类,分出来多种数据类型。
在C语言中,按照取值的不同,数据类型可以分为两类:
原子类型:是不可以再分解的基本类型,包括整型、实型、字符型等。
结构类型:由若干个类型组合而成,是可以再分解的。例如整型数组是由若干整型数据组成的。
比如:在C语言中声明变量
int a,b;
这就意味着,在给变量赋值时不能超出int的取值范围,变量a和b之间的运算只能是int类型所允许的运算。
1.7.2抽象数据类型
抽象是指抽取出事物具有的普遍性的本质。它是抽出问题的特质而忽略非本质的细节,是对具体事物的一个概括。抽象是一种思考问题的方式,它隐藏了繁杂的细节,只保留实现目标所必需的信息。
我们对已有的数据类型进行抽象,就有了抽象数据类型。
抽象数据类型(Abstract Data Type,ADT):一个数学模型及定义在该模型上的一组操作。抽象数据类型的定义仅取决于它的一组逻辑特性,而与其在计算机内部如何表示和实现无关。
比如在各个计算机,不管是大型机还是小型机、pc、平板电脑,甚至智能手机都拥有“整数“类型,也需要整数间的运算,那么整型其实就是一个抽象数据类型,尽管它在上面提到的这些在不同的计算机中实现方法上可能不一样,但是由于其定义的数学特性相同,在计算机编程者看来,它们都是相同的。因此,“抽象”的意义在于数据类型的数学抽象特性。
而且,抽象数据类型不仅仅指那些已经定义并实现的数据类型,还可以是计算机编程者在设计软件程序时自己定义的数据类型。根据抽象数据类型的定义,它还包括定义在该模型上的一组操作。
就像“超级玛丽”这个任天堂经典游戏,里面的游戏主角马里奥,我们给他定义了几种基本操作(前进、后退、上、下)、跳、发射子弹等。刚开始马里奥只能走和跳,后来根据玩家要求和更好的游戏体验,又增加了跑和发射子弹的操作,所以一个抽象数据类型到底需要那些操作,就只能由设计者根据实际需要来设计操作了。
抽象数据类型体现了程序设计中问题分解、抽象和信息隐藏的特性。
我们描述抽象数据类型的标准格式:
ADT 抽象数据类型名
Data
数据元素之间逻辑关系的定义
Operation
操作1
初始条件
操作结果描述
操作2
......
操作n
......
endADT
1.8总结
到底什么是数据结构?
数据结构:数据结构是相互之间存在一种或多种特定关系的数据元素的集合。
数据对象>数据元素>数据项