索引堆基本理解
- 最小生成树算法, 还是最短路径算法, 我们都需要使用索引堆进行优化。
- 索引堆解决普通堆的一些局限性
- 堆中存储的元素结构复杂,交换元素的代价很大
- 堆建成后改变了原本他在数组中的位置,我们如果想要修改某个元素的值,将会很困难,如果添加一个元素表示他原来的位置的话,我们需要遍历一遍堆才能找到进行修改,这样的性能也是低效的
对于索引堆来说,我们将数据和索引这两部分分开存储。真正表征堆的这个数组是由索引这个数组构建成的。(像下图中那
样,每个结点的位置写的是索引号)
构建堆(以最大索引堆为例)的时候,比较的是data中的值(即原来数组中对应索引所存的值),构建成堆的是index域
而构建完之后,data域并没有发生改变,位置改变的是index域。
实现代码
package Heap.IndexHeap;
import java.util.Arrays;
/**
* @ Description: 索引堆 解决修改堆中元素
* @ Date: Created in 09:41 2018/7/31
* @ Author: Anthony_Duan
*/
public class IndexMaxHeap<Item extends Comparable> {
//最大索引堆中的元素
protected Item[] data;
//最大索引堆中的索引
protected int[] indexes;
protected int count;
protected int capacity;
//构造幻术,构建一个空堆,可容纳capacity个元素
public IndexMaxHeap(int capacity) {
data = (Item[]) new Comparable[capacity + 1];
indexes = new int[capacity + 1];
count = 0;
this.capacity = capacity;
}
//返回索引堆中的元素的个数
public int size() {
return count;
}
//判断索引堆是否为空
public boolean isEmpty(){
return count == 0;
}
/**
* 向最大索引堆中插入一个新元素,新元素的索引为i,元素为item
* @param i
* @param item
*/
public void insert(int i, Item item) {
assert count + 1 <= capacity;
assert i + 1 >= 1 && i + 1 <= capacity;
//传入的i对用户而言,是从0索引的
i += 1;
data[i] = item;
indexes[count + 1] = i;
count++;
shiftUp(count);
}
//从最大索引堆中取出堆定元素,即索引堆中所存储的最大元素
public Item extractMax() {
assert count > 0;
Item ret = data[indexes[1]];
swapIndexes(1, count);
count--;
shiftDown(1);
return ret;
}
//从最大索引堆中取出堆顶元素的索引
public int extractMaxIndex(){
assert count > 0;
int ret = indexes[1] - 1;
swapIndexes(1, count);
count--;
return ret;
}
//获取索引堆中的堆顶元素
public Item getMax() {
assert count > 0;
return data[indexes[1]];
}
//获取索引堆中索引为i的元素
public Item getItem(int i) {
assert 1 + 1 >= 1 && 1 + 1 <= capacity;
return data[i + 1];
}
//获取最大索引堆中的堆顶元素的索引
public int getMaxIndex(){
assert count > 0;
return indexes[1] - 1;
}
//将最大索引堆中索引为i的元素修改为newItem
public void change(int i, Item newItem) {
i += 1;
data[i] = newItem;
// 找到indexes[j] = i, j表示data[i]在堆中的位置
// 之后shiftUp(j), 再shiftDown(j)
for (int j = 1; j <=count ; j++) {
if (indexes[j] == i) {
shiftUp(j);
shiftDown(j);
return;
}
}
}
// 交换索引堆中的索引i和j
private void swapIndexes(int i, int j){
int t = indexes[i];
indexes[i] = indexes[j];
indexes[j] = t;
}
//********************
//* 最大索引堆核心辅助函数
//********************
// 索引堆中, 数据之间的比较根据data的大小进行比较, 但实际操作的是索引
private void shiftUp(int k) {
while (k > 1 && data[indexes[k / 2]].compareTo(data[indexes[k]])<0) {
swapIndexes(k, k / 2);
k /= 2;
}
}
// 索引堆中, 数据之间的比较根据data的大小进行比较, 但实际操作的是索引
private void shiftDown(int k) {
while (2 * k <= count) {
int j = 2 * k;
if (j++ <= count && data[indexes[j + 1]].compareTo(data[indexes[j]]) > 0) {
j++;
}
if (data[indexes[k]].compareTo(data[indexes[j]]) >= 0) {
break;
}
swapIndexes(k, j);
k = j;
}
}
// 测试索引堆中的索引数组index
// 注意:这个测试在向堆中插入元素以后, 不进行extract操作有效
public boolean testIndexes(){
int[] copyIndexes = new int[count+1];
for( int i = 0 ; i <= count ; i ++ ) {
copyIndexes[i] = indexes[i];
}
copyIndexes[0] = 0;
Arrays.sort(copyIndexes);
// 在对索引堆中的索引进行排序后, 应该正好是1...count这count个索引
boolean res = true;
for( int i = 1 ; i <= count ; i ++ ) {
if( copyIndexes[i-1] + 1 != copyIndexes[i] ){
res = false;
break;
}
}
if( !res ){
System.out.println("Error!");
return false;
}
return true;
}
// 测试 IndexMaxHeap
public static void main(String[] args) {
int N = 1000000;
IndexMaxHeap<Integer> indexMaxHeap = new IndexMaxHeap<Integer>(N);
for( int i = 0 ; i < N ; i ++ ) {
indexMaxHeap.insert( i , (int)(Math.random()*N) );
}
assert indexMaxHeap.testIndexes();
}
}
索引堆的优化
从上面的代码可以看到,根据索引修改索引堆中的元素的时间复杂度为O(n)依旧过高,问题还是在于要找到这个元素需要遍历整个堆的索引,所以利用同样的思想可以解决这个问题,再加一个属性即索引的索引——反向索引
package Heap.IndexHeap;
import java.util.Arrays;
/**
* @ Description: 利用反向索引优化索引堆
* @ Date: Created in 11:45 2018/7/31
* @ Author: Anthony_Duan
*/
public class IndexMaxHeapAdvance<Item extends Comparable> {
protected Item[] data; // 最大索引堆中的数据
protected int[] indexes; // 最大索引堆中的索引, indexes[x] = i 表示索引i在x的位置
protected int[] reverse; // 最大索引堆中的反向索引, reverse[i] = x 表示索引i在x的位置
protected int count;
protected int capacity;
// 构造函数, 构造一个空堆, 可容纳capacity个元素
public IndexMaxHeapAdvance(int capacity){
data = (Item[])new Comparable[capacity+1];
indexes = new int[capacity+1];
reverse = new int[capacity+1];
for( int i = 0 ; i <= capacity ; i ++ ) {
reverse[i] = 0;
}
count = 0;
this.capacity = capacity;
}
// 返回索引堆中的元素个数
public int size(){
return count;
}
// 返回一个布尔值, 表示索引堆中是否为空
public boolean isEmpty(){
return count == 0;
}
// 向最大索引堆中插入一个新的元素, 新元素的索引为i, 元素为item
// 传入的i对用户而言,是从0索引的
public void insert(int i, Item item){
assert count + 1 <= capacity;
assert i + 1 >= 1 && i + 1 <= capacity;
// 再插入一个新元素前,还需要保证索引i所在的位置是没有元素的。
assert !contain(i);
i += 1;
data[i] = item;
indexes[count+1] = i;
reverse[i] = count + 1;
count ++;
shiftUp(count);
}
// 从最大索引堆中取出堆顶元素, 即索引堆中所存储的最大数据
public Item extractMax(){
assert count > 0;
Item ret = data[indexes[1]];
swapIndexes( 1 , count );
reverse[indexes[count]] = 0;
count --;
shiftDown(1);
return ret;
}
// 从最大索引堆中取出堆顶元素的索引
public int extractMaxIndex(){
assert count > 0;
int ret = indexes[1] - 1;
swapIndexes( 1 , count );
reverse[indexes[count]] = 0;
count --;
shiftDown(1);
return ret;
}
// 获取最大索引堆中的堆顶元素
public Item getMax(){
assert count > 0;
return data[indexes[1]];
}
// 获取最大索引堆中的堆顶元素的索引
public int getMaxIndex(){
assert count > 0;
return indexes[1]-1;
}
// 看索引i所在的位置是否存在元素
boolean contain( int i ){
assert i + 1 >= 1 && i + 1 <= capacity;
return reverse[i+1] != 0;
}
// 获取最大索引堆中索引为i的元素
public Item getItem( int i ){
assert contain(i);
return data[i+1];
}
// 将最大索引堆中索引为i的元素修改为newItem
public void change( int i , Item newItem ){
assert contain(i);
i += 1;
data[i] = newItem;
// 找到indexes[j] = i, j表示data[i]在堆中的位置
// 之后shiftUp(j), 再shiftDown(j)
// for( int j = 1 ; j <= count ; j ++ )
// if( indexes[j] == i ){
// shiftUp(j);
// shiftDown(j);
// return;
// }
// 有了 reverse 之后,
// 我们可以非常简单的通过reverse直接定位索引i在indexes中的位置
shiftUp( reverse[i] );
shiftDown( reverse[i] );
}
// 交换索引堆中的索引i和j
// 由于有了反向索引reverse数组,
// indexes数组发生改变以后, 相应的就需要维护reverse数组
private void swapIndexes(int i, int j){
int t = indexes[i];
indexes[i] = indexes[j];
indexes[j] = t;
reverse[indexes[i]] = i;
reverse[indexes[j]] = j;
}
//********************
//* 最大索引堆核心辅助函数
//********************
// 索引堆中, 数据之间的比较根据data的大小进行比较, 但实际操作的是索引
private void shiftUp(int k){
while( k > 1 && data[indexes[k/2]].compareTo(data[indexes[k]]) < 0 ){
swapIndexes(k, k/2);
k /= 2;
}
}
// 索引堆中, 数据之间的比较根据data的大小进行比较, 但实际操作的是索引
private void shiftDown(int k){
while( 2*k <= count ){
int j = 2*k;
if( j+1 <= count && data[indexes[j+1]].compareTo(data[indexes[j]]) > 0 ) {
j ++;
}
if( data[indexes[k]].compareTo(data[indexes[j]]) >= 0 ) {
break;
}
swapIndexes(k, j);
k = j;
}
}
// 测试索引堆中的索引数组index和反向数组reverse
// 注意:这个测试在向堆中插入元素以后, 不进行extract操作有效
public boolean testIndexes(){
int[] copyIndexes = new int[count+1];
int[] copyReverseIndexes = new int[count+1];
for( int i = 0 ; i <= count ; i ++ ) {
copyIndexes[i] = indexes[i];
copyReverseIndexes[i] = reverse[i];
}
copyIndexes[0] = 0;
copyReverseIndexes[0] = 0;
Arrays.sort(copyIndexes);
Arrays.sort(copyReverseIndexes);
// 在对索引堆中的索引和反向索引进行排序后,
// 两个数组都应该正好是1...count这count个索引
boolean res = true;
for( int i = 1 ; i <= count ; i ++ ) {
if( copyIndexes[i-1] + 1 != copyIndexes[i] ||
copyReverseIndexes[i-1] + 1 != copyReverseIndexes[i] ){
res = false;
break;
}
}
if( !res ){
System.out.println("Error!");
return false;
}
return true;
}
// 测试 IndexMaxHeap
public static void main(String[] args) {
int N = 1000000;
IndexMaxHeap<Integer> indexMaxHeap = new IndexMaxHeap<Integer>(N);
for( int i = 0 ; i < N ; i ++ ) {
indexMaxHeap.insert( i , (int)(Math.random()*N) );
}
assert indexMaxHeap.testIndexes();
}
}