1つは、ヒープソートの紹介です
ヒープソート(ヒープソート)は、ヒープのデータ構造を使用して設計されたソートアルゴリズムを指します。
したがって、ヒープソートを学習する前に、ヒープを理解する必要があります。読者がヒープに慣れていない場合は、最初にヒープを理解してから(バイナリヒープ、左傾斜ヒープ、斜めヒープ、二項ヒープ、フィボナッチヒープなどの記事で理解することをお勧めします)、次に学習することをお勧めします。この章。
ヒープは「最大のヒープ」と「最小のヒープ」に分けられることがわかっています。通常、最大のヒープは「昇順」の並べ替えに使用され、最小のヒープは「降順」の並べ替えに使用されます。
最大ヒープと最小ヒープの間の対称関係を考慮して、そのうちの1つを理解してください。この記事では、最大ヒープによって実装される昇順ソートについて詳しく説明します。
最大のヒープを昇順でソートする基本的な考え方:
①ヒープを初期化する:シーケンスa [1 ... n]を最大のヒープに構築します。
②データ交換:a [1]とa [n]をa [1 ... n]の最大値になるように交換し、a [1 ... n-1]を最大ヒープに再調整します。 。次に、a [1]とa [n-1]を入れ替えて、a [n-1]がa [1 ... n-1]の最大値になるようにします。次に、a [1 ... n-2]を再調整します。最大値まで。など、シーケンス全体が整うまで続きます。
以下では、グラフィックとテキストによるヒープソートの実装プロセスを分析します。実装では「配列によって実装されるバイナリヒープの性質」が使用されることに注意してください。
最初の要素のインデックスが0の場合:
プロパティ1:インデックスiを
持つ左の子のインデックスは(2 i + 1);プロパティ2:インデックスiを持つ左の子のインデックスは(2 i + 2);
プロパティ3:インデックスiの親ノードのインデックスはfloor((i-1)/ 2);
たとえば、最大のヒープの場合{110,100,90,40,80,20,60,10,30 、50,70}に関して:インデックス0の左の子はすべて1、インデックス0の右の子は2、インデックス8の親ノードは3です。
2、ヒープソートのグラフィックの説明
ヒープソート(昇順)コード
/*
* (最大)堆的向下调整算法
*
* 注:数组实现的堆中,第N个节点的左孩子的索引值是(2N+1),右孩子的索引是(2N+2)。
* 其中,N为数组下标索引值,如数组中第1个数对应的N为0。
*
* 参数说明:
* a -- 待排序的数组
* start -- 被下调节点的起始位置(一般为0,表示从第1个开始)
* end -- 截至范围(一般为数组中最后一个元素的索引)
*/
void maxheap_down(int a[], int start, int end)
{
int c = start; // 当前(current)节点的位置
int l = 2*c + 1; // 左(left)孩子的位置
int tmp = a[c]; // 当前(current)节点的大小
for (; l <= end; c=l,l=2*l+1)
{
// "l"是左孩子,"l+1"是右孩子
if ( l < end && a[l] < a[l+1])
l++; // 左右两孩子中选择较大者,即m_heap[l+1]
if (tmp >= a[l])
break; // 调整结束
else // 交换值
{
a[c] = a[l];
a[l]= tmp;
}
}
}
/*
* 堆排序(从小到大)
*
* 参数说明:
* a -- 待排序的数组
* n -- 数组的长度
*/
void heap_sort_asc(int a[], int n)
{
int i;
// 从(n/2-1) --> 0逐次遍历。遍历之后,得到的数组实际上是一个(最大)二叉堆。
for (i = n / 2 - 1; i >= 0; i--)
maxheap_down(a, i, n-1);
// 从最后一个元素开始对序列进行调整,不断的缩小调整的范围直到第一个元素
for (i = n - 1; i > 0; i--)
{
// 交换a[0]和a[i]。交换后,a[i]是a[0...i]中最大的。
swap(a[0], a[i]);
// 调整a[0...i-1],使得a[0...i-1]仍然是一个最大堆。
// 即,保证a[i-1]是a[0...i-1]中的最大值。
maxheap_down(a, 0, i-1);
}
}
heap_sort_asc(a、n)の関数は、配列aを昇順でソートすることです。ここで、aは配列、nは配列の長さです。
heap_sort_asc(a、n)の操作は、ヒープの初期化とデータの交換の2つの部分に分かれています。
maxheap_down(a、start、end)は、最大ヒープの下方調整アルゴリズムです。
以下は、a = {20,30,90,40,70,110,60,10,100,50,80}、n = 11でのheap_sort_asc(a、n)のヒープソートプロセスを示しています。配列aに対応する初期化構造は次のとおりです
。1ヒープを初期化します。
ヒープソートアルゴリズムでは、ソートされる配列は最初にバイナリヒープに変換されます。
以下は、配列{20,30,90,40,70,110,60,10,100,50,80}を最大のヒープ{110,100,90,40,80,20,60,10,30,50に変換する手順を示しています。 、70}。
1.1 i = 11 / 2-1、つまりi = 4
上記は、maxheap_down(a、4、9)の調整プロセスです。maxheap_down(a、4、9)の機能は、a [4 ... 9]をダウンレギュレートすることです。a[4]の左の子はa [9]で、右の子はa [10]です。調整するときは、左右の子の大きい方(つまり、a [10])を選択し、a [4]を交換します。
1.2 i = 3
上記は、maxheap_down(a、3、9)調整プロセスです。maxheap_down(a、3、9)の機能は、a [3 ... 9]をダウンレギュレートすることです。a[3]の左の子はa [7]で、右の子はa [8]です。調整するときは、左右の子の大きい方(つまり、a [8])を選択し、a [4]を交換します。
1.3 i = 2
上記はmaxheap_down(a、2、9)調整プロセスです。maxheap_down(a、2、9)の機能は、a [2…9]をダウンレギュレートすることです。a[2]の左の子はa [5]で、右の子はa [6]です。調整するときは、左右の子の大きい方(つまり、a [5])を選択し、a [2]を交換します。
1.4
上記のi = 1は、maxheap_down(a、1、9)の調整プロセスです。maxheap_down(a、1、9)の関数は、a [1 ... 9]をダウンレギュレートすることです。a[1]の左の子はa [3]で、右の子はa [4]です。調整するときは、左右の子の大きい方(つまり、a [3])を選択し、a [1]を交換します。交換後、a [3]は30であり、右の子a [8]よりも大きいため、交換されます。
1.5 i = 0
上記はmaxheap_down(a、0、9)調整プロセスです。maxheap_down(a、0、9)の機能は、a [0…9]をダウンレギュレートすることです。a[0]の左の子はa [1]で、右の子はa [2]です。調整するときは、左右の子の大きい方(つまり、a [2])を選択し、a [0]を交換します。交換後、a [2]は20で、左右の子よりも大きくなります。a[2]と交換する年上の子(つまり、左の子)を選択します。
調整が完了すると、最大ヒープが取得されます。このとき、配列{20,30,90,40,70,110,60,10,100,50,80}も{110,100,90,40,80,20,60,10,30,50,70}になります。
パート2データの交換
配列が最大のヒープに変換された後、データが交換されるため、配列は真の順序付き配列になります。
データ交換部分は比較的単純です。以下は、配列の最後に最大値を配置するための概略図です。
上記は、n = 10の場合のデータ交換の概略図です。
n = 10の場合、最初にa [0]とa [10]を入れ替えて、a [10]がa [0…10]間の最大値になるようにします。次に、a [0…9]を調整して最大ヒープにします。交換後:a [10]が整いました!
n = 9の場合、最初にa [0]とa [9]を交換して、a [9]がa [0…9]間の最大値になるようにします。次に、a [0…8]を調整して最大ヒープにします。交換後:a [9 ... 10]が整いました!
…
など、a [0…10]が整うまで続きます。
編集者は私自身のlinuxC / C ++言語技術交換グループを推奨しています:[ 1106675687 ]グループファイルで共有する方が良いと思う学習本とビデオ資料をいくつかまとめました。必要に応じて追加できます。
第三に、ヒープソートの時間計算量と安定性
ヒープソートの時間計算量ヒープソートの時間計算量
はO(N lgN)です。ソートされているシーケンスにN個の番号があるとします。トラバーサルの時間計算量はO(N)です。トラバーサルはいくつ必要ですか?
ヒープソートは、バイナリヒープを使用してソートされます。バイナリヒープはバイナリツリーです。トラバースする必要がある回数は、バイナリツリーの深さです。完全なバイナリツリーの定義によれば、その深さは少なくともlg( N + 1)。最大値はいくつですか?バイナリヒープは完全なバイナリツリーであるため、その深さは最大でlg(2N)を超えることはありません。したがって、トラバーサルの時間計算量はO(N)であり、トラバーサルの数はlg(N + 1)とlg(2N)の間です。したがって、その時間計算量はO(N lgN)です。
ヒープソートの安定性
ヒープソートは不安定なアルゴリズムであり、安定したアルゴリズムの定義を満たしていません。データを交換するときは、親ノードと子ノードの間でデータを比較するため、値が等しい兄弟ノードが2つある場合でも、並べ替えの際に相対的な順序が変わる可能性があります。
アルゴリズムの安定性-シーケンスにa [i] = a [j]があると仮定します。ソート前の場合、a [i]はa [j]の前にあり、ソート後、a [i]はまだa [j]の前にあります。そうすれば、このソートアルゴリズムは安定しています!
4、ヒープソートの実装
ヒープソートの3つの実装を以下に示します:C、C ++、およびJava。これら3つの実装の原理と出力結果は同じです。各実装には、「最大ヒープの昇順」と「最小ヒープの降順」が含まれます。
ヒープソートのC実装
实现代码(heap_sort.c)
View Code
ヒープソートのC ++実装
实现代码(HeapSort.cpp)
View Code
ヒープソートのJava実装
实现代码(HeapSort.java)
View Code
それらの出力:
before sort:20 30 90 40 70 110 60 10 100 50 80
after sort:10 20 30 40 50 60 70 80 90 100 110