深入浅出数据结构（一）

文章目录

前言
1. 数据结构

1.1 数据结构说明及特点

2. 详细介绍

2.1 数组
2.2 栈
2.3 队列
2.4 链表
2.5 树
2.6 散列表(哈希表)
2.7 堆
2.8 图

前言

此篇为数据结构相关内容连载第一篇，为博主总结所得，如有错误，请指出！我及时更正！

1. 数据结构

数组（无序，有序），栈，队列（循环队列，双端队列）,链表（单链表，双端链表），哈希表(也叫散列表)，堆，树，图
如下图所示：
在这里插入图片描述

1.1 数据结构说明及特点

数组：大小固定，有序数组就是按一定顺序排列的数组
栈：后进先出，Stack底层是采用数组来实现的
队列：队列同样是一种特殊的线性表，其插入和删除的操作分别在表的两端进行，队列的特点就是先进先出(First In First Out)
队列使用场景：
模拟现实世界中的队列，如售票柜台的队列以及其他先到先服务的场景。
计算客户在呼叫中心等待的时间。
异步数据的传输（文件输入输出、管道、嵌套字）。
操作系统中的优先级任务执行。
短信群体发送应用的发布订阅模式
链表：空间可以不连续
哈希表：快速的插入操作和查找操作。其key基于数组来实现。key-value
堆：是一个可动态申请的内存空间，是一个特殊的二叉树
树：树形结构是一类重要的非线性结构。树形结构是结点之间有分支，并具有层次关系的结构。
图：是一种复杂的非线性数据结构。

数据结构	优点	缺点
数组	插入快，如果知道下标，可以快速的存取	查找慢，删除慢，大小固定
有序数组	比无序的数组查找快	删除慢, 大小固定, 插入时要按排序方式把后面的数据进行移动
栈	后进先出	存取其他项很慢
队列	先进先出	存取其他项很慢
链表	插入块，删除快	查找慢
二叉树	查找，插入，删除都很快（如果树保持平衡）	删除算法复杂
红黑树	查找，插入，删除都很快	算法复杂
哈希表	如果关键字已知则存取快。插入块	删除慢。如果不知关键字则存取很慢，对存储空间使用不充分
堆	插入、删除快，对最大数据项的存取快	对其它数据项的存取很慢
图	对现实世界建模	有些算法慢且复杂

2. 详细介绍

每一种数据结构都有着独特的数据存储方式，下面为大家详细介绍它们的结构和优缺点

2.1 数组

数组是可以再内存中连续存储多个元素的结构，在内存中的分配也是连续的，数组中的元素通过数组下标进行访问，数组下标从0开始。例如下面这段代码就是将数组的第一个元素赋值为 1。

int[] data = new int[100]；data[0]  = 1;

优点：
1、按照索引查询元素速度快
2、按照索引遍历数组方便
缺点：
1、数组的大小固定后就无法扩容了
2、数组只能存储一种类型的数据
3、添加，删除的操作慢，因为要移动其他的元素。

适用场景：
频繁查询，对存储空间要求不大，很少增加和删除的情况。

2.2 栈

栈是一种特殊的线性表，仅能在线性表的一端操作，栈顶允许操作，栈底不允许操作。栈的特点是：先进后出，或者说是后进先出，从栈顶放入元素的操作叫入栈，取出元素叫出栈。
在这里插入图片描述
栈的结构就像一个集装箱，越先放进去的东西越晚才能拿出来，所以，栈常应用于实现递归功能方面的场景，例如斐波那契数列。

2.3 队列

队列与栈一样，也是一种线性表，不同的是，队列可以在一端添加元素，在另一端取出元素，也就是：先进先出。从一端放入元素的操作称为入队，取出元素为出队，示例图如下：
在这里插入图片描述

使用场景：因为队列先进先出的特点，在多线程阻塞队列管理中非常适用。

2.4 链表

链表是物理存储单元上非连续的、非顺序的存储结构，数据元素的逻辑顺序是通过链表的指针地址实现，每个元素包含两个结点，一个是存储元素的数据域 (内存空间)，另一个是指向下一个结点地址的指针域。根据指针的指向，链表能形成不同的结构，例如单链表，双向链表，循环链表等。
在这里插入图片描述
链表的优点：
链表是很常用的一种数据结构，不需要初始化容量，可以任意加减元素；
添加或者删除元素时只需要改变前后两个元素结点的指针域指向地址即可，所以添加，删除很快；

缺点：
因为含有大量的指针域，占用空间较大；
查找元素需要遍历链表来查找，非常耗时。

适用场景：
数据量较小，需要频繁增加，删除操作的场景

2.5 树

树是一种数据结构，它是由n（n>=1）个有限节点组成一个具有层次关系的集合。把它叫做 “树” 是因为它看起来像一棵倒挂的树，也就是说它是根朝上，而叶朝下的。它具有以下的特点：

每个节点有零个或多个子节点；
没有父节点的节点称为根节点；
每一个非根节点有且只有一个父节点；
除了根节点外，每个子节点可以分为多个不相交的子树；

在日常的应用中，我们讨论和用的更多的是树的其中一种结构，就是二叉树。
在这里插入图片描述
二叉树是树的特殊一种，具有如下特点：

1、每个结点最多有两颗子树，结点的度最大为2。
2、左子树和右子树是有顺序的，次序不能颠倒。
3、即使某结点只有一个子树，也要区分左右子树。

二叉树是一种比较有用的折中方案，它添加，删除元素都很快，并且在查找方面也有很多的算法优化，所以，二叉树既有链表的好处，也有数组的好处，是两者的优化方案，在处理大批量的动态数据方面非常有用。

扩展：
二叉树有很多扩展的数据结构，包括平衡二叉树、红黑树、B+树（数据库底层中详细讲述了）等，这些数据结构二叉树的基础上衍生了很多的功能，在实际应用中广泛用到，例如mysql的数据库索引结构用的就是B+树，还有HashMap的底层源码中用到了红黑树(JDK1.8起，链表的长度超过了8)。这些二叉树的功能强大，但算法上比较复杂，想学习的话还是后续需要花时间去深入的。

2.6 散列表(哈希表)

散列表，也叫哈希表，是根据关键码和值 (key和value) 直接进行访问的数据结构，通过key和value来映射到集合中的一个位置，这样就可以很快找到集合中的对应元素。

记录的存储位置=f(key)

这里的对应关系 f 成为散列函数，又称为哈希 (hash函数)，而散列表就是把Key通过一个固定的算法函数既所谓的哈希函数转换成一个整型数字，然后就将该数字对数组长度进行取余，取余结果就当作数组的下标，将value存储在以该数字为下标的数组空间里，这种存储空间可以充分利用数组的查找优势来查找元素，所以查找的速度很快。

哈希表在应用中也是比较常见的，就如Java中有些集合类就是借鉴了哈希原理构造的，例如HashMap，HashTable等，利用hash表的优势，对于集合的查找元素时非常方便的，然而，因为哈希表是基于数组衍生的数据结构，在添加删除元素方面是比较慢的，所以很多时候需要用到一种数组链表来做，也就是拉链法。拉链法是数组结合链表的一种结构，较早前的hashMap底层的存储就是采用这种结构，直到jdk1.8之后才换成了数组加红黑树的结构，其示例图如下：
在这里插入图片描述

从图中可以看出，左边很明显是个数组，数组的每个成员包括一个指针，指向一个链表的头，当然这个链表可能为空，也可能元素很多。我们根据元素的一些特征把元素分配到不同的链表中去，也是根据这些特征，找到正确的链表，再从链表中找出这个元素。

哈希表的应用场景很多，当然也有很多问题要考虑，比如哈希冲突的问题，如果处理的不好会浪费大量的时间，导致应用崩溃。

2.7 堆

堆是一种比较特殊的数据结构，可以被看做一棵树的数组对象，具有以下的性质：

堆中某个节点的值总是不大于或不小于其父节点的值；
堆总是一棵完全二叉树。

将根节点最大的堆叫做最大堆或大根堆，根节点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、斐波那契堆等。

堆的定义如下：n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时，称之为堆。
(ki <= k2i,ki <= k2i+1)或者(ki >= k2i,ki >= k2i+1), (i = 1,2,3,4…n/2)，满足前者的表达式的成为小顶堆，满足后者表达式的为大顶堆，这两者的结构图可以用完全二叉树排列出来，示例图如下：

在这里插入图片描述
因为堆有序的特点，一般用来做数组中的排序，称为堆排序。