[Go版]算法通关村第十四关青铜——原来这就是堆

堆的概念和特征

堆是一个很大的概念,不一定是完全二叉树。下面说的用完全二叉树是因为这个很容易被数组储存,但是除了这种二叉堆之后,还有二项堆、斐波那契堆,这些堆就不属于二叉树。

堆是将一组数组按照完全二叉树的存储顺序,将数据存储在一个一维数组中的结构。
完全二叉树:每一层都是满的,除了最底层,最底层的节点都靠左排列。

堆有两种结构:大顶堆、小顶堆。(有些地方也叫大根堆、小根堆、最大堆、最小堆… )

  • 小顶堆:任意节点的值均 <= 它的左右孩子,并且最小值位于堆顶,即根节点处。
  • 大顶堆:任意节点的值均 >= 它的左右孩子,并且最大值位于堆顶,即根节点处。
    在这里插入图片描述

父子关系:(i-1)/2

假设一个节点的下标是i

  1. i=0时,为根节点;
  2. i>=1时,父节点索引是 (i-1)/2
  3. 下标i的节点,其左子节点索引是2*i+1,右子节点索引是2*i+2

堆的构造过程

构造堆的过程被称为"堆化",它可以分为两种不同的方式:自底向上和自顶向下。

在构造堆的过程中,堆化操作会反复执行,直到整个堆满足堆的性质。

构造堆的时间复杂度通常是 O ( n ) O(n) O(n),其中n是堆中元素的数量。

在堆排序等算法中,首先通过自底向上堆化将数组构造成堆,然后依次取出堆顶元素进行排序,最终实现高效的排序操作。

自底向上堆化(Bottom-up Heapify)

这种方法从最后一个非叶子节点开始,逐步向上调整节点,使得以该节点为根的子树满足堆的性质。具体步骤如下:

  • 从最后一个非叶子节点开始,向前遍历所有非叶子节点。
  • 对于每个非叶子节点,比较它与其子节点的值,如果不满足堆的性质,则交换节点与较大(或较小,根据最大堆或最小堆)子节点的位置。
  • 继续向前遍历,直到根节点,这样整个堆就满足了堆的性质。

举例

下面看一下如何建立一个大堆:
将元素 [12 23 54 2 65 45 92 47 204 31] 依次排到完全二叉树节点上去,如下左图所示。

  1. int i = (size - 2)/2 = 4(思考一下这里为什么是size-2而不是size-1)。找到数组中的4号下标。65大于其孩子,满足大堆性质,所以不用交换。如下右图
    在这里插入图片描述

解答:因为数组中最后一个元素的索引是size-1,所以最后一个非叶子节点的索引(其父节点)是(size-2)/2

  1. 然后i= i-1;然后用2和其孩子比较,2和204交换。交换之后204所在的子树满足大堆,如下左图。

  2. 54和其孩子比较,54和92交换。此时92所在子树满足大堆,如下右图。
    在这里插入图片描述

  3. 继续,23和其孩子比较,23和204交换,交换完之后,23的子树却不满足了,所以还需调整它的子树。 如下两图所示。
    在这里插入图片描述

  4. 12和204交换,仍然出现不平衡的情况,以此类推,直到根节点也满足要求就完毕了。
    在这里插入图片描述

这样我们就建好了一个大顶堆,从图中可以看到,根元素是整个树中值最大的那个,而第二大和第三大就是其左右子树,具体是哪个更大则是未知的,需要比较一下才知道。

另外,对于同一组数据,如果输入的序列不一样,那最终构造的树是否也会不一样呢?非常有可能,那这样的树有什么意义呢?我们后面再看,这里先理解堆是这么构建的就行了。

自顶向下堆化(Top-down Heapify)

这种方法是从根节点开始,逐步向下调整节点,使得以该节点为根的子树满足堆的性质。具体步骤如下:

  • 从根节点开始,比较它与其子节点的值,如果不满足堆的性质,则与较大(或较小,根据最大堆或最小堆)子节点交换位置。
  • 交换后,继续对被交换的子节点进行堆化,直到叶子节点,或者子节点满足堆的性质为止。

插入操作

从上面可以看到根节点和其左右子节点是堆里的老大老二和老三,其他结点则没有太明显的规律,那如果要插入一个新元素,该怎么做呢?

直接说规则:插入操作会首先将新元素添加到堆的末尾,然后通过与其父节点比较并可能进行交换,以维持堆的性质。

举例

如下图,要插入300, 我们将其插入到31的右孩子位置,然后不断向上爬,31<300,所以两者要交换,再向上发现300比65大,所以两者要交换。最后300比根元素204大,两者也交换。最后就得到了新的堆。完整过程如下所示:
在这里插入图片描述

删除操作

堆本身比较特殊,一般对堆中的数据进行操作都是针对堆顶的元素,即每次都从堆中获得最大值或最小值,其他的不关心,所以我们删除的时候,也是删除堆顶。如果直接删掉堆顶,整个结构被破坏了,群龙无首就不易管理了。

所以实际策略是:先将堆中最后一个元素(假如为A)和堆顶元素进行替换,然后删除堆中最后一个元素。之后再从根开始逐步与左右比较,谁更大谁上位。然后A再继续与子树比较,如果有更大的继续交换,直到自己所在的子树也满足大顶堆。

上面的过程可以理解为皇上突然驾崩了,这时候先找个顾命大臣维持局面,大臣先看左右两个皇子谁更强谁就是老大。然后大臣自己再逐步隐退,直到找到属于自己的位置。

举例

在这里插入图片描述
最后新的堆结构如下:
在这里插入图片描述

堆结构的价值

说了这么多,你觉得这东西的价值在哪里呢?

价值就在于大顶堆的根节点是整个树最大的那个,增加时会根据根的大小来决定要不要加,而删除操作只删除根元素。这个特征可以在很多场景下有奇妙的应用,后面的算法题全都基于这一点。

总结下就是:堆是一种优秀的数据结构,它能够在维护性质的同时,提供高效的操作。适用于一些需要高效插入、删除、查找最大(或最小)元素的场景,比如优先队列、堆排序等。

这里可能有些人还有疑问,感觉不管插入还是删除,堆的操作都不简单,那为什么还说堆的效率比较高呢?

这是因为堆元素的数量是有限制的,一般不用将所有的元素都放到堆里。后面题目中可以看到,在序列中找K大,则堆的大小就是K。如果K个链表合并,那么堆就是K。

口诀

关于堆的问题,记住口诀:

查找:找大用小,大的进;找小用大,小的进。
排序:升序用小,降序用大。

查找的口诀解释一下就是:是找K大,则用小堆,后续数据只有比根元素更大时才允许进入堆。如果是找K小,则对应反过来。

猜你喜欢

转载自blog.csdn.net/trinityleo5/article/details/132457904