数据结构:常见的排序算法(五):堆排序(C++实现)

数据结构:常见的排序算法(五):堆排序

堆排序是一种树形选择排序,是对直接选择排序的有效改进。堆是一种特殊的树形数据结构,即完全二叉树。堆分为大根堆和小根堆,大根堆为根节点的值大于两个子节点的值;小根堆为根节点的值小于两个子节点的值,同时根节点的两个子树也分别是一个堆。

堆的定义下:具有n个元素的序列 (h1,h2,…,hn),当且仅当满足(hi>=h2i,hi>=2i+1)或(hi<=h2i,hi<=2i+1) (i=1,2,…,n/2)时称之为堆。在这里只讨论满足前者条件的堆。由堆的定义可以看出,堆顶元素(即第一个元素)必为最大项(大顶堆)。完全二叉树可以很直观地表示堆的结构。堆顶为根,其它为左子树、右子树。 (可以延伸到前序遍历、中序遍历、后序遍历)

1.基本思想

初始时把要排序的数的序列看作是一棵顺序存储的二叉树,调整它们的存储序,使之成为一个堆,这时堆的根节点的数最大。然后将根节点与堆的最后一个节点交换。然后对前面(n-1)个数重新调整使之成为堆。依此类推,直到只有两个节点的堆,并对它们作交换,最后得到有n个节点的有序序列。从算法描述来看,堆排序需要两个过程,一是建立堆,二是堆顶与堆的最后一个元素交换位置。所以堆排序有两个函数组成。一是建堆的渗透函数,二是反复调用渗透函数实现排序的函数。

​ 难点有(1)如何把一个序列生成大根堆

​ (2)输出堆顶元素后,如何使剩下的元素生成一个大根堆

思路:

  • 步骤一:建立大根堆–将n个元素组成的无序序列构建一个大根堆,

  • 步骤二:交换堆元素–交换堆尾元素和堆首元素,使堆尾元素为最大元素;

  • 步骤三:重建大根堆–将前n-1个元素组成的无序序列调整为大根堆

    重复执行步骤二和步骤三,直到整个序列有序。

2.实例

示例1:arr[]

img

图片来源:https://www.cnblogs.com/zwtgyh/p/10631760.html

#include<iostream>
#include<vector>
using namespace std;

// 递归方式构建大根堆(len是arr的长度,index是第一个非叶子节点的下标)
void adjust(vector<int> &arr, int len, int index)
{
	int left = 2 * index + 1; // index的左子节点
	int right = 2 * index + 2;// index的右子节点

	int maxIdx = index;
	if (left<len && arr[left] > arr[maxIdx])     maxIdx = left;
	if (right<len && arr[right] > arr[maxIdx])     maxIdx = right;

	if (maxIdx != index)
	{
		swap(arr[maxIdx], arr[index]);
		adjust(arr, len, maxIdx);
	}

}

// 堆排序
void heapSort(vector<int> &arr, int size)
{
	// 构建大根堆(从最后一个非叶子节点向上)
	for (int i = size / 2 - 1; i >= 0; i--)
	{
		adjust(arr, size, i);
	}

	// 调整大根堆
	for (int i = size - 1; i >= 1; i--)
	{
		swap(arr[0], arr[i]);           // 将当前最大的放置到数组末尾
		adjust(arr, i, 0);              // 将未完成排序的部分继续进行堆排序
	}
}

int main()
{
	vector<int> arr = { 8,6,7,4,5,3,2,1 };
	heapSort(arr, arr.size());
	for (int i = 0; i<arr.size(); i++)
	{
		cout << arr[i] <<"  ";
	}
	cout << endl;
	return 0;
}

示例2:arr[4,6,8,5,9]通过堆排序进行排序

  • 步骤一:建立大根堆

① 无序序列建立完全二叉树

image

② 从最后一个叶子节点开始,从左到右,从下到上调整,将完全二叉树调整为大根堆

a.找到第1个非叶子节点6,由于6的右子节点9比6大,所以交换6和9。交换后,符合大根堆的结构。

image

c.找到第2个非叶子节点4,由于的4左子节点9比4大,所以交换4和9。交换后不符合大根堆的结构,继续从右到左,从下到上调整。

image

image

  • 步骤二:交换堆元素(交换堆首和堆尾元素–获得最大元素)

image

  • 步骤三:重建大根堆(前n-1个元素)

image

  • 重复执行步骤二和步骤三,直到整个序列有序

image

图片来源:https://www.cnblogs.com/chengxiao/p/6129630.html

实例代码:

#include<iostream>
#include<vector>
using namespace std;

// 递归方式构建大根堆(len是arr的长度,index是第一个非叶子节点的下标)
void adjust(vector<int> &arr, int len, int index)
{
	int left = 2 * index + 1; // index的左子节点
	int right = 2 * index + 2;// index的右子节点

	int maxIdx = index;
	if (left<len && arr[left] > arr[maxIdx])     maxIdx = left;
	if (right<len && arr[right] > arr[maxIdx])     maxIdx = right;

	if (maxIdx != index)
	{
		swap(arr[maxIdx], arr[index]);
		adjust(arr, len, maxIdx);
	}

}

// 堆排序
void heapSort(vector<int> &arr, int size)
{
	// 构建大根堆(从最后一个非叶子节点向上)
	for (int i = size / 2 - 1; i >= 0; i--)
	{
		adjust(arr, size, i);
	}

	// 调整大根堆
	for (int i = size - 1; i >= 1; i--)
	{
		swap(arr[0], arr[i]);           // 将当前最大的放置到数组末尾
		adjust(arr, i, 0);              // 将未完成排序的部分继续进行堆排序
	}
}

int main()
{
	vector<int> arr = { 4, 6, 8, 5, 9 };
	heapSort(arr, arr.size());
	for (int i = 0; i<arr.size(); i++)
	{
		cout << arr[i] <<"  ";
	}
	cout << endl;
	return 0;
}

3.总结

  • 堆排序的时间复杂度主要由两部分组成:初始化建堆和每次弹出堆顶元素后重新建堆的过程
  • 初始化建堆过程的时间复杂度O(n):假设堆的高度为k,则从倒数第二层右边的节点开始,这一层的节点都要进行子节点比较然后选择是否交换,倒数第三层类似,一直到第一层(即层数从k-1到1);那么总的时间为(2(i-1))*(k-i),其中i表示第i层(范围是k-1到1),2(i-1)表示该层上有多少元素,(k-i)表示子树上要比较的次数,即S = 2^(k-2)*1 + 2^(k-3)2 + 2^(k-4)3 + … + 2^1(k-2) + 2^0(k-1),使用错位相减法(用常数2来辅助转换,两边都乘以2再减去原等式)得到S = 2^(K-1) + 2^(K-2) + 2^(K-3) + … + 2 - (K-1),忽略最后一项常数项就是等比数列,即S=2k-2-(k-1)=2k-k-1,又因为k为完全二叉树的深度,所以有 2^k <= n < 2^k-1,可以认为k = logn,综上所述S = n - logn -1,所以时间复杂度为O(n)
  • 弹出堆顶元素后重建堆过程的时间复杂度O(nlogn):循环n-1次,每次都从跟节点往下循环查找所以每一次时间都是logn,总时间为(n-1)*logn = nlogn - logn
  • 故堆排序的时间复杂度为O(n) + O(nlogn) = O(nlogn)
  • 堆排序是接地排序,所以空间复杂度为常数O(1)

猜你喜欢

转载自blog.csdn.net/qq_43801020/article/details/108136124