数据结构
早期人们理解的计算机只是数值计算的工具,所以计算机解决问题,是
- 先从具体问题抽象出一个适当的数据模型,
- 设计出一个解此数学模型的算法
- 编写程序,得到一个实际的软件
可现实中,我们更多的不是解决数值计算的问题,而是需要一些更科学有效的手段(比如:表、树、图)的帮助,才能更好地处理问题。
数据结构是一门研究非数值计算的 程序设计问题中的 操作对象,以及它们之间的关系和操作等相关问题的学科。
程序设计 = 数据结构 + 算法
数据:是描述客观事物的符号,是计算机中可以操作的对象,是能被计算机识别,并输入给计算机处理的符号集合。包括:
a. 数值类型:整型、实型
b. 非数值类型:字符、声音、图像、视频
数据元素:是组成数据的、有一定意义的基本单位,在计算机中通常作为整体处理,也被称为记录。
例如 :牛、马、羊、鸡猪、狗等是畜类的数据元素。
数据项:一个数据元素可以由若干个数据项组成(数据项是数据不可分割的最小单位)
例如:人这样的数据元素,可以有眼、耳、鼻、嘴、手、脚等数据项,也可有姓名、年龄、性别、联系电话等数据项
数据对象:是性质相同的数据元素的集合,是数据的子集
性质相同:数据元素具有相同数量和类型的数据项,比如:人都有姓名、性别等相同的数据项
在实际应用中,基本都将数据对象简称为数据
数据结构:是相互之间存在一种或多种特定关系的数据元素的集合。
按照视点的不同,将数据结构分为:逻辑结构和物理结构(存储结构)
逻辑结构:是指数据对象中数据元素之间的相互关系
1. 集合结构
集合结构中的数据元素除了同属一个集合外,没有其他关系
2. 线性结构
线性结构中的数据元素之间是一对一的关系
3. 树形结构
树形结构中的数据元素之间是一对多的层次关系
4. 图形结构
图形结构中的数据元素之间是多对多的关系
物理结构:是指数据的逻辑结构在计算机中的存储形式
数据的存储结构应正确反映数据元素之间的逻辑关系,存储形式有两种:顺序存储、链式存储
1. 顺序存储结构
顺序存储结构:把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的(数组就是顺序存储结构)
2.链式存储结构
链式存储结构:把数据元素存放在任意的存储单元里,这组存储单元可以是连续的,也可以是不连续的
逻辑结构是面向问题的,物理结构是面向计算机的,其基本的目标就是将数据及逻辑关系存储到计算机的内存中
数据类型:指一组性质相同的值得集合及定义在此集合上得一些操作得总称
例如:在C语言中,类型就是用来说明变量或表达式得取值范围和所能进行得操作。
抽象数据类型(Abstract Data Type,ADT):指一个数学模型及定义在该模型上的一组操作
抽象数据类型的标准格式如下:
ADT 抽象数据类型名
Data
数据元素之间逻辑关系的定义
Operation
操作1
初始条件
操作结果描述
操作2
......
操作n
.......
endADT
算法
算法:是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作
算法特性:输入、输出、有穷性、确定性、可行性
输入输出:算法具有零个或多个输入,一个或多个输出
有穷性:指算法在执行有限个步骤后,能够自动结束,并且每个步骤在可接受的范围内
确定性:算法的每一步都有确定的含义,不会出现二义性
可行性:算法的每一步都得是可行的
算法设计的要求:正确性、可读性、健壮性、时间效率高和存储量低
算法效率的度量方法:
事后统计方法(放弃)
事前分析估算方法:在计算机程序编制前,依据统计方法对算法进行估算
- 算法采用的策略、方法(根本)
- 编译产生的代码质量(软件支持)
- 问题的输入规模(关键)
- 机器执行指令的速度
函数的渐近增长:给定两个函数f(n)和 g(n)(n为输入规模),如果存在一个整数N,使得对于所有的n > N ,f(n)总是比 g(n)大,那么我们就说f(n)的增长渐近快于 g(n)。
算法时间复杂度
在进行算法分析是,语句总的执行次数T(n)是关于问题规模 n 的函数,进而分析T(n)随 n 的变化情况并确定T(n)的数量级。算法的时间复杂度也就是时间度量,记作:T(n)=O(f(n))(f (n) 是问题规模 n 的某个函数)。表示:随问题规模 n 的增大,算法执行时间的增长率和f(n)的增长率相同,称作算法的渐近时间复杂度,简称时间复杂度
推导大O阶方法
- 用常数1取代运行时间中的所有加法常数
- 在修改后的运行次数函数中,只保留最高阶项
- 如果最高阶项存在且不是1,则去除与这个项相乘的常数
算法空间复杂度
算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算公式记作:S(n)= O(f(n)),其中 n 为问题的规模,f(n)为语句关于 n 所占存储空间的函数