二叉树基础及二叉树顺序结构

1.树的相关概念

节点的度：一个节点含有的子树的个数称为该节点的度；如上图：A的为6。
叶节点或终端节点：度为0的节点称为叶节点；如上图：B、C、H、I...等节点为叶节点。
双亲节点或父节点：若一个节点含有子节点，则这个节点称为其子节点的父节点；如上图：A是B的父节点。
孩子节点或子节点：一个节点含有的子树的根节点称为该节点的子节点；如上图：B是A的孩子节点。
兄弟节点：具有相同父节点的节点互称为兄弟节点；如上图：B、C是兄弟节点
树的度：一棵树中，最大的节点的度称为树的度；如上图：树的度为6
树的高度或深度：树中节点的最大层次；如上图：树的高度为4
堂兄弟节点：双亲在同一层的节点互为堂兄弟；如上图：H、I互为兄弟节点
节点的祖先：从根到该节点所经分支上的所有节点；如上图：A是所有节点的祖先
子孙：以某节点为根的子树中任一节点都称为该节点的子孙。如上图：所有节点都是A的子孙
森林：由m（m>0）棵互不相交的树的集合称为森林；

2.二叉树

2.1概念：一棵二叉树是结点的一个有限集合，该集合由1. 或者为空；2. 由一个根节点加上两棵别称为左子树和右子树的二叉树组成。

从上图可以看出：
1. 二叉树不存在度大于2的结点
2. 二叉树的子树有左右之分，次序不能颠倒，因此二叉树是有序树
注意：对于任意的二叉树都是由以下几种情况复合而成的：

2.2特殊二叉树

1. 满二叉树：一个二叉树，如果每一个层的结点数都达到最大值，则这个二叉树就是满二叉树。也就是说，如果一个二叉树的层数为K，且结点总数是2^K -1，则它就是满二叉树。

2. 完全二叉树：完全二叉树是效率很高的数据结构，完全二叉树是由满二叉树而引出来的。对于深度为K的，有n个结点的二叉树，当且仅当其每一个结点都与深度为K的满二叉树中编号从1至n的结点一一对应时称之为完全二叉树。通俗说就是，一颗高度为h，节点个数为n的完全二叉树，其前h-1 层已经排满,第h层从左到右依次排列，与相同高度的满二叉树的前n个节点排列方式相同。要注意的是满二叉树是一种特殊的完全二叉树。

2.3二叉树的性质

1. 若规定根节点的层数为1，则一棵非空二叉树的第i层上最多有2^(i-1) 个结点.
2. 若规定根节点的层数为1，则深度为h的二叉树的最大结点数是2^h - 1 .
3. 对任何一棵二叉树, 如果度为0其叶结点个数为n0 , 度为2的分支结点个数为 n2,则有 n0＝n2 ＋1.
4. 若规定根节点的层数为1，具有n个结点的满二叉树的深度，h 是log以2为底，n+1为对数.
5. 对于具有n个结点的完全二叉树，如果按照从上至下从左至右的数组顺序对所有节点从0开始编号，则对
于序号为i的结点有：
1. 若i>0，i位置节点的双亲序号：(i-1)/2；i=0，i为根节点编号，无双亲节点
2. 若2i+1<n，左孩子序号：2i+1，2i+1>=n否则无左孩子
3. 若2i+2<n，右孩子序号：2i+2，2i+2>=n否则无右孩子

3.二叉树的顺序结构

3.1普通的二叉树是不适合用数组来存储的，因为可能会存在大量的空间浪费。而完全二叉树更适合使用顺序结构存储。现实中我们通常把堆(一种二叉树)使用顺序结构的数组来存储，需要注意的是这里的堆和操作系统虚拟进程地址空间中的堆是两回事，一个是数据结构，一个是操作系统中管理内存的一块区域分段。

3.2 堆的概念及结构
如果有一个关键码的集合K = {K0 ，K1 ，K2 ，…，Kn-1 }，把它的所有元素按完全二叉树的顺序存储方式存储在一个一维数组中，并满足：Ki <=K2*i+1 且 Ki<=K2*i+2 ( Ki >=K2*i+1 且Ki>=K2*i+2 ) i = 0，1，2…，则称为小堆(或大堆)。将根节点最大的堆叫做最大堆或大根堆，根节点最小的堆叫做最小堆或小根堆。
堆的性质：
堆中某个节点的值总是不大于或不小于其父节点的值；
堆总是一棵完全二叉树。

3.3堆向下调整算法
现在我们给出一个数组，逻辑上看做一颗完全二叉树。我们通过从根节点开始的向下调整算法可以把它调整成一个小堆。向下调整算法有一个前提：左右子树必须是一个堆，才能调整。

//向下调整
void AdjustDown(Heap* hp, int parent){
	//child的作用：标记左右孩子中较小的那个孩子
	//默认标记左孩子，因为在完全二叉树这种结构中可能有左孩子而没有右孩子的情况
	//但是一定有右孩子
	int child = parent * 2 + 1;
	while (child < hp->size){ //条件成立，确保一定存在左孩子
		//在保证除只有左孩子没有右孩子条件下，在比较左右孩子
		if (((child + 1) < hp->size) && (hp->Compare(hp->array[child + 1], hp->array[child])) ){
			child += 1;
		}
		//如果父母大于较小的那个孩子，二者进行交换
		if (hp->Compare(hp->array[child],hp->array[parent])){
			swap(&hp->array[parent], &hp->array[child]);
			//调整之后不能保证后面的父母比孩子小
			//所以仍要继续往下调整
			parent = child;
			child = parent * 2 + 1;
		}
		else{
			return;
		}
	}
}

3.4堆的构建

1.初始化堆；2.构建堆；3.从最后一个节点的双亲开始调整，按照完全二叉树的序号，依次往前调整

// 堆的构建
void HeapCreate(Heap* hp, HPDataType* a, int n,COM p){
	//1.初始化堆
	hp->array = (HPDataType*)malloc(n*sizeof(HPDataType));
	if (hp->array == NULL){
		return;
	}
	hp->capacity = n;
	hp->size = 0;
	//2.构建堆
	memcpy(hp->array, a, n*sizeof(HPDataType));
	hp->size = n;
	hp->Compare = p;
	//3.从最后一个节点的双亲开始调整，按照完全二叉树的序号，依次往前调整
	for (int root = (hp->size - 2) / 2; root >= 0; root--){
		AdjustDown(hp, root);
	}
}

3.5堆构建的时间复杂度

因为堆是完全二叉树，而满二叉树也是完全二叉树，此处为了简化使用满二叉树来证明(时间复杂度本来看的就是近似值，多几个节点不影响最终结果)：

因此：建堆的时间复杂度为O(N)。

3.5堆的插入
1.先将元素插入到堆的末尾，即最后一个孩子之后。
2.插入之后如果堆的性质遭到破坏，将新插入节点顺着其双亲往上调整到合适位置即可。

// 堆的插入
void HeapPush(Heap* hp, HPDataType x){
	//判满
	CheckCapacity(hp);
	hp->array[hp->size] = x;
	hp->size += 1;
	AdjustUp(hp);
}

3.6堆的删除

1.将堆顶元素与堆中最后-个元素进行交换；2.删除堆中最后一个元素；3.将堆顶元素向下调整到满足堆特性为止

// 堆的删除
void HeapPop(Heap* hp){
	if (HeapEmpty(hp)){
		return;
	}
	swap(&hp->array[0], &hp->array[hp->size - 1]);
	hp->size -= 1;
	AdjustDown(hp, 0);
}

3.7堆的应用

1.堆排序

堆排序即利用堆的思想来进行排序，总共分为两个步骤：1.建堆，升序：建大堆，降序：建小堆；2. 利用堆删除思想来进行排序。

//向下调整
void HeapAdjust(int* array, int parent, int size){
	int child = parent * 2 + 1;
	while (child < size){
		if (child + 1 < size && array[child + 1] > array[child]){
			child += 1;
		}
		if (array[parent] < array[child]){
			swap(&array[parent], &array[child]);
			parent = child;
			child = parent * 2 + 1;
		}
		else{
			return;
		}
	}
}

// 对数组进行堆排序
void HeapSort(int* a, int n){
	for (int root = (n - 2) / 2; root >= 0; root--){
		HeapAdjust(a, root, n);
	}
	swap(&a[0], &a[n - 1]);
	int count = n - 1;
	while (count > 0){
		HeapAdjust(a, 0, count);
		swap(&a[0], &a[count - 1]);
		count -= 1;
	}
}

2.TOP-K问题：即求数据中前K个最大的元素或者最小的元素，一般情况下数据量都比较大。

对于Top-K问题，能想到的最简单直接的方式就是排序，但是：如果数据量非常大，排序就不太可取了(可能数据都不能一下子全部加载到内存中)。最佳的方式就是用堆来解决，基本思路如下：
1. 用数据集合中前K个元素来建堆
前k个最大的元素，则建小堆
前k个最小的元素，则建大堆
2. 用剩余的N-K个元素依次与堆顶元素来比较，不满足则替换堆顶元素

//Top-K
void PrintTopK(int* a, int n, int k){
	// 1. 建堆--用a中前k个元素建堆
	//前k个最小元素--大堆，前k个最大元素--小堆
	for (int root = (k - 2) / 2; root >= 0; root--){//大堆
		HeapAdjust(a, root, k);
	}
	// 2. 将剩余n-k个元素依次与堆顶元素交换，不满则则替换
	for (int i = k; i < n; i++){
		if (a[i]<a[0]){
			swap(&a[0], &a[i]);
			HeapAdjust(a, 0, k);
		}
		else{
			continue;
		}
	}
	for (int i = 0; i < k; i++){
		printf("%d ", a[i]);
	}
}

二叉树基础及二叉树顺序结构

猜你喜欢