一.AVL树
AVL树是一种平衡树, 它由:
俄罗斯的计算机科学家G. M. Adelson-Velsky 和 E. M. Landis发明,故名为AVL
1962年的论文首次提出
是最早的自平衡二分搜索树结构
平衡二叉树的定义: 叶子节点间的深度相差不超过1。
例子: 线段树 满二叉树 完全二叉树
对于AVL,我们会适当放宽平衡二叉树的要求:
对于任意一个节点,左子树和右子树的高度差不能超过1
如下图所示的树结构即 AVL
上图中的平衡二叉树的高度的节点数量之间的关系也是O(logn), 和之前严格定义的平衡二叉树一样。
平衡因子
计算节点的高度:
节点对应的左右子树中, 最高的高度+1
计算平衡因子:
左右子树的高度差
如下图所示 黑色数字为高度, 蓝色为平衡因子
'不存在大于1的平衡因子, 则为平衡二叉树。'
显然 上图中的二叉树,不是平衡二叉树!
二. 计算节点的高度和平衡因子
我们计算一下以前的二分搜索树BST的高度和平衡因子。
将BST.java改造为AVLTree.java, 打印出BST的平衡因子
import java.util.ArrayList;
public class AVLTree<K extends Comparable<K>, V> {
private class Node {
public K key;
public V value;
public Node left, right;
public int height; // 记录高度值
public Node(K key, V value) {
this.key = key;
this.value = value;
left = null;
right = null;
height = 1; // 初始化高度为1
}
}
private Node root;
private int size;
public AVLTree() {
root = null;
size = 0;
}
public int getSize() {
return size;
}
public boolean isEmpty() {
return size == 0;
}
// 获取节点高度
private int getHeight(Node node) {
if (node == null) {
return 0;
}
return node.height;
}
// 向二分搜索树中添加新的元素(key, value)
public void add(K key, V value) {
root = add(root, key, value);
}
// 获取节点的平衡因子
private int getBalanceFactor(Node node) {
if (node == null) {
return 0;
}
return getHeight(node.left)-getHeight(node.right);
}
// 向以node为根的二分搜索树中插入元素(key, value),递归算法
// 返回插入新节点后二分搜索树的根
private Node add(Node node, K key, V value) {
if (node == null) {
size++;
return new Node(key, value);
}
if (key.compareTo(node.key) < 0)
node.left = add(node.left, key, value);
else if (key.compareTo(node.key) > 0)
node.right = add(node.right, key, value);
else // key.compareTo(node.key) == 0
node.value = value;
// 更新height
node.height = 1 + Math.max(getHeight(node.left), getHeight(node.right));
// 计算平衡因子
int balanceFactor = getBalanceFactor(node);
if(Math.abs(balanceFactor) > 1){
System.out.println("unbalanced : " + balanceFactor);
}
return node;
}
// 返回以node为根节点的二分搜索树中,key所在的节点
private Node getNode(Node node, K key) {
if (node == null)
return null;
if (key.equals(node.key))
return node;
else if (key.compareTo(node.key) < 0)
return getNode(node.left, key);
else // if(key.compareTo(node.key) > 0)
return getNode(node.right, key);
}
public boolean contains(K key) {
return getNode(root, key) != null;
}
public V get(K key) {
Node node = getNode(root, key);
return node == null ? null : node.value;
}
public void set(K key, V newValue) {
Node node = getNode(root, key);
if (node == null)
throw new IllegalArgumentException(key + " doesn't exist!");
node.value = newValue;
}
// 返回以node为根的二分搜索树的最小值所在的节点
private Node minimum(Node node) {
if (node.left == null)
return node;
return minimum(node.left);
}
// 删除掉以node为根的二分搜索树中的最小节点
// 返回删除节点后新的二分搜索树的根
private Node removeMin(Node node) {
if (node.left == null) {
Node rightNode = node.right;
node.right = null;
size--;
return rightNode;
}
node.left = removeMin(node.left);
return node;
}
// 从二分搜索树中删除键为key的节点
public V remove(K key) {
Node node = getNode(root, key);
if (node != null) {
root = remove(root, key);
return node.value;
}
return null;
}
private Node remove(Node node, K key) {
if (node == null)
return null;
if (key.compareTo(node.key) < 0) {
node.left = remove(node.left, key);
return node;
} else if (key.compareTo(node.key) > 0) {
node.right = remove(node.right, key);
return node;
} else { // key.compareTo(node.key) == 0
// 待删除节点左子树为空的情况
if (node.left == null) {
Node rightNode = node.right;
node.right = null;
size--;
return rightNode;
}
// 待删除节点右子树为空的情况
if (node.right == null) {
Node leftNode = node.left;
node.left = null;
size--;
return leftNode;
}
// 待删除节点左右子树均不为空的情况
// 找到比待删除节点大的最小节点, 即待删除节点右子树的最小节点
// 用这个节点顶替待删除节点的位置
Node successor = minimum(node.right);
successor.right = removeMin(node.right);
successor.left = node.left;
node.left = node.right = null;
return successor;
}
}
public static void main(String[] args) {
System.out.println("Pride and Prejudice");
ArrayList<String> words = new ArrayList<>();
if (FileOperation.readFile("pride-and-prejudice.txt", words)) {
System.out.println("Total words: " + words.size());
AVLTree<String, Integer> map = new AVLTree<>();
for (String word : words) {
if (map.contains(word))
map.set(word, map.get(word) + 1);
else
map.add(word, 1);
}
System.out.println("Total different words: " + map.getSize());
System.out.println("Frequency of PRIDE: " + map.get("pride"));
System.out.println("Frequency of PREJUDICE: " + map.get("prejudice"));
}
System.out.println();
}
}
项目的目录展示:
.
├── AVLTree.java
├── BST.java
├── FileOperation.java
├── Main.java
└── pride-and-prejudice.txt
运行AVLTree.java
unbalanced : 4
unbalanced : 7
unbalanced : -6
unbalanced : 4
unbalanced : 10
unbalanced : 4
unbalanced : 7
....
可以看到以前的二分搜索树BST,的平衡性很差.
三. 检查二分搜索树的性质和平衡性
新增两个方法:
- 判断是否为二分搜索树isBST
- 利用中序遍历, 将所有节点的key存入数组中,
- 如果最后数组中的值按大小顺序排列,则为二分搜索树
- 判断是否为平衡二叉树isBalanced
- 递归遍历节点的平衡因子, 只要有>1的, 就不是平衡二叉树
AVLTree.java
...
// 判断该二叉树是否是一棵二分搜索树
public boolean isBST() {
ArrayList<K> keys = new ArrayList<>();
inOrder(root, keys);
for(int i=1; i < keys.size(); i++){
if(keys.get(i-1).compareTo(keys.get(i)) > 0){
return false;
}
}
return true;
}
// 中序遍历 将key的值存入keys中, 随后keys中的值是 按顺序排列的, 则为二分搜索树
private void inOrder(Node node, ArrayList<K> keys){
if(node == null){
return;
}
inOrder(node.left, keys);
keys.add(node.key);
inOrder(node.right, keys);
}
// 判断当前的树 是否为平衡二叉树
public boolean isBalanced(){
return isBalanced(root);
}
// 判断以Node为根的二叉树是否是一棵平衡二叉树, 递归算法
private boolean isBalanced(Node node){
if(node == null){
return true;
}
int balanceFactor = getBalanceFactor(node);
if(Math.abs(balanceFactor) > 1){
return false;
}
return isBalanced(node.left) && isBalanced(node.right);
}
...
public static void main(String[] args) {
...
System.out.println("is BST : " + map.isBST());
System.out.println("is Balances : " + map.isBalanced());
}
System.out.println();
}
}
运行结果
...
is BST : true
is Balances : false
四. 旋转操作的基本原理
判断是否需要维护平衡
从最下边的节点向根结点追溯, 一旦出现平衡因子>1,就需要进行平衡维护。
旋转操作
有如下图的二分搜索树:
- T1, T2, T3, T4是四棵子树
- y节点的平衡因子>1
- 各节点对应的值满足二分搜索树性质: T1<z<T2>x>T3>y>T4
右旋转操做:
1. x.right=y
2. y.left = T3
得到的新树, 除了有二分搜索树的性质外, 也一定是平衡的。为什么?
1. 我们在判断出现不平衡的情况并维护平衡,是在进行添加节点的时候(add函数)。
即在添加节点前y是平衡,添加一个节点后,出现了不平衡。y平衡因子只能是2
2. 假设 为旋转前 x的高度为h+2, 则z=h+1, T3=h+1或h , T4=h,
则右旋转后的高度为 z依然为h+1, y=T3+1 即h+2或h+1 ,
所以x的平衡因子为 'abs(z-y) = 1或0 '
五. 右旋转和左旋转的实现
-
右旋转的代码实现
AVLTree.java
...
// 对节点y进行向右旋转操作,返回旋转后新的根节点x
// y x
// / \ / \
// x T4 向右旋转 (y) z y
// / \ - - - - - - - -> / \ / \
// z T3 T1 T2 T3 T4
// / \
// T1 T2
private Node rightRotate(Node y){
Node x = y.left;
Node T3 = x.right;
//向右旋转
x.right = y;
y.left= T3;
//更新height
y.height = Math.max(getHeight(y.left), getHeight(y.right)) + 1;
x.height = Math.max(getHeight(x.left), getHeight(x.right)) + 1;
return x;
}
// 向以node为根的二分搜索树中插入元素(key, value),递归算法
// 返回插入新节点后二分搜索树的根
private Node add(Node node, K key, V value) {
if (node == null) {
size++;
return new Node(key, value);
}
if (key.compareTo(node.key) < 0)
node.left = add(node.left, key, value);
else if (key.compareTo(node.key) > 0)
node.right = add(node.right, key, value);
else // key.compareTo(node.key) == 0
node.value = value;
// 更新height
node.height = 1 + Math.max(getHeight(node.left), getHeight(node.right));
// 计算平衡因子
int balanceFactor = getBalanceFactor(node);
if (Math.abs(balanceFactor) > 1) {
System.out.println("unbalanced : " + balanceFactor);
}
// 平衡维护
if (balanceFactor > 1 && getBalanceFactor(node.left) >= 0) {
return rightRotate(node);
}
return node;
}
...
-
左旋转
左旋转就是右旋转的对称
左旋转的代码实现
AVLTree.java
...
// 对节点y进行向左旋转操作,返回旋转后新的根节点x
// y x
// / \ / \
// T1 x 向左旋转 (y) y z
// / \ - - - - - - - -> / \ / \
// T2 z T1 T2 T3 T4
// / \
// T3 T4
private Node leftRotate(Node y) {
Node x = y.right;
Node T2 = x.left;
// 向左旋转过程
x.left = y;
y.right = T2;
// 更新height
y.height = Math.max(getHeight(y.left), getHeight(y.right)) + 1;
x.height = Math.max(getHeight(x.left), getHeight(x.right)) + 1;
return x;
}
// 向以node为根的二分搜索树中插入元素(key, value),递归算法
// 返回插入新节点后二分搜索树的根
private Node add(Node node, K key, V value) {
if (node == null) {
size++;
return new Node(key, value);
}
if (key.compareTo(node.key) < 0)
node.left = add(node.left, key, value);
else if (key.compareTo(node.key) > 0)
node.right = add(node.right, key, value);
else // key.compareTo(node.key) == 0
node.value = value;
// 更新height
node.height = 1 + Math.max(getHeight(node.left), getHeight(node.right));
// 计算平衡因子
int balanceFactor = getBalanceFactor(node);
if (Math.abs(balanceFactor) > 1) {
System.out.println("unbalanced : " + balanceFactor);
}
// 平衡维护
if (balanceFactor > 1 && getBalanceFactor(node.left) >= 0) {
return rightRotate(node);
}
if(balanceFactor < -1 && getBalanceFactor(node.left) <= 0) {
return leftRotate(node);
}
return node;
}
...
六. LR和RL
将适用于右旋转的情况称为LL, 适用于左旋转的情况称为RR。 那么还有两种情况LR和RL没有考虑。
LR和RL在解决时, 可以向LL和RR转化处理。如下图
代码编写
AVLTree.java
...
// 向以node为根的二分搜索树中插入元素(key, value),递归算法
// 返回插入新节点后二分搜索树的根
private Node add(Node node, K key, V value) {
...
// 平衡维护
//LL
if (balanceFactor > 1 && getBalanceFactor(node.left) >= 0) {
return rightRotate(node);
}
//RR
if(balanceFactor < -1 && getBalanceFactor(node.left) <= 0) {
return leftRotate(node);
}
//LR
if (balanceFactor > 1 && getBalanceFactor(node.left) < 0) {
node.left = leftRotate(node.left);
return rightRotate(node);
}
// RL
if (balanceFactor < -1 && getBalanceFactor(node.left) > 0) {
node.right = rightRotate(node.right);
return leftRotate(node);
}
return node;
...
再次运行AVLTree的Main测试函数
Pride and Prejudice
Total words: 125901
Total different words: 6530
Frequency of PRIDE: 53
Frequency of PREJUDICE: 11
is BST : true
is Balanced : true
与BST效率对比
Main.java
import java.util.ArrayList;
import java.util.Collections;
public class Main {
public static void main(String[] args) {
System.out.println("Pride and Prejudice");
ArrayList<String> words = new ArrayList<>();
if(FileOperation.readFile("pride-and-prejudice.txt", words)) {
System.out.println("Total words: " + words.size());
Collections.sort(words); //排序, BST会退化为链表
// Test BST
long startTime = System.nanoTime();
BST<String, Integer> bst = new BST<>();
for (String word : words) {
if (bst.contains(word))
bst.set(word, bst.get(word) + 1);
else
bst.add(word, 1);
}
for(String word: words)
bst.contains(word);
long endTime = System.nanoTime();
double time = (endTime - startTime) / 1000000000.0;
System.out.println("BST: " + time + " s");
// Test AVL Tree
startTime = System.nanoTime();
AVLTree<String, Integer> avl = new AVLTree<>();
for (String word : words) {
if (avl.contains(word))
avl.set(word, avl.get(word) + 1);
else
avl.add(word, 1);
}
for(String word: words)
avl.contains(word);
endTime = System.nanoTime();
time = (endTime - startTime) / 1000000000.0;
System.out.println("AVL: " + time + " s");
}
System.out.println();
}
}
Pride and Prejudice
Total words: 125901
BST: 16.425630819 s
AVL: 0.088163974 s
BST在最坏的情况下(最坏情况退化为链表),AVL有明显优势。AVL更稳定,BST无法预知是否会出现退化。
七.从AVL中删除元素
在AVL树中删除节点时, 如果平衡被破坏, 我们需要和add一样进行平衡维护。
AVLTree.java
...
// 从二分搜索树中删除键为key的节点
public V remove(K key){
Node node = getNode(root, key);
if(node != null){
root = remove(root, key);
return node.value;
}
return null;
}
private Node remove(Node node, K key){
if( node == null )
return null;
Node retNode; //保存remove要返回的node
if( key.compareTo(node.key) < 0 ){
node.left = remove(node.left , key);
// return node;
retNode = node;
}
else if(key.compareTo(node.key) > 0 ){
node.right = remove(node.right, key);
// return node;
retNode = node;
}
else{ // key.compareTo(node.key) == 0
// 待删除节点左子树为空的情况
if(node.left == null){
Node rightNode = node.right;
node.right = null;
size --;
// return rightNode;
retNode = rightNode;
}
// 待删除节点右子树为空的情况
else if(node.right == null){
Node leftNode = node.left;
node.left = null;
size --;
// return leftNode;
retNode = leftNode;
}
// 待删除节点左右子树均不为空的情况
else{
// 找到比待删除节点大的最小节点, 即待删除节点右子树的最小节点
// 用这个节点顶替待删除节点的位置
Node successor = minimum(node.right);
//successor.right = removeMin(node.right); 这里的问题很容易忽略, remove也需要平衡维护
successor.right = remove(node.right, successor.key);
successor.left = node.left;
node.left = node.right = null;
// return successor;
retNode = successor;
}
}
if(retNode == null)
return null;
// 更新height
retNode.height = 1 + Math.max(getHeight(retNode.left), getHeight(retNode.right));
// 计算平衡因子
int balanceFactor = getBalanceFactor(retNode);
// 平衡维护
// LL
if (balanceFactor > 1 && getBalanceFactor(retNode.left) >= 0)
return rightRotate(retNode);
// RR
if (balanceFactor < -1 && getBalanceFactor(retNode.right) <= 0)
return leftRotate(retNode);
// LR
if (balanceFactor > 1 && getBalanceFactor(retNode.left) < 0) {
retNode.left = leftRotate(retNode.left);
return rightRotate(retNode);
}
// RL
if (balanceFactor < -1 && getBalanceFactor(retNode.right) > 0) {
retNode.right = rightRotate(retNode.right);
return leftRotate(retNode);
}
return retNode;
}
...
八. 基于AVL树的集合和映射
AVL树可以防止二分搜索树退化成链表, 提高了稳定性。
1.MAP实现
实现AVL树的MAP, 只需要在现有的AVLTree进行封装
接口 Map.java
public interface Map<K, V> {
void add(K key, V value);
boolean contains(K key);
V get(K key);
void set(K key, V newValue);
V remove(K key);
int getSize();
boolean isEmpty();
}
AVLMap.java
public class AVLMap<K extends Comparable<K>, V> implements Map<K, V> {
private AVLTree<K, V> avl;
public AVLMap(){
avl = new AVLTree<>();
}
@Override
public int getSize(){
return avl.getSize();
}
@Override
public boolean isEmpty(){
return avl.isEmpty();
}
@Override
public void add(K key, V value){
avl.add(key, value);
}
@Override
public boolean contains(K key){
return avl.contains(key);
}
@Override
public V get(K key){
return avl.get(key);
}
@Override
public void set(K key, V newValue){
avl.set(key, newValue);
}
@Override
public V remove(K key){
return avl.remove(key);
}
}
2. SET的实现
接口SET.java
public interface Set<E> {
void add(E e);
boolean contains(E e);
void remove(E e);
int getSize();
boolean isEmpty();
}
AVLSet.java
public class AVLSet<E extends Comparable<E>> implements Set<E> {
private AVLTree<E, Object> avl;
public AVLSet(){
avl = new AVLTree<>();
}
@Override
public int getSize(){
return avl.getSize();
}
@Override
public boolean isEmpty(){
return avl.isEmpty();
}
@Override
public void add(E e){
avl.add(e, null);//AVLTree中存的是键值对, set中不需要value,设为null
}
@Override
public boolean contains(E e){
return avl.contains(e);
}
@Override
public void remove(E e){
avl.remove(e);
}
}