Java 树结构实际应用二（哈夫曼树和哈夫曼编码）

赫夫曼树

1 基本介绍

1) 给定 n 个权值作为 n 个叶子结点，构造一棵二叉树，若该树的带权路径长度(wpl)达到最小，称这样的二叉树为

最优二叉树，也称为哈夫曼树(Huffman Tree), 还有的书翻译为霍夫曼树。

2) 赫夫曼树是带权路径长度最短的树，权值较大的结点离根较近

2 赫夫曼树几个重要概念和举例说明

1) 路径和路径长度：在一棵树中，从一个结点往下可以达到的孩子或孙子结点之间的通路，称为路径。通路

中分支的数目称为路径长度。若规定根结点的层数为 1，则从根结点到第 L 层结点的路径长度为 L-1

2) 结点的权及带权路径长度：若将树中结点赋给一个有着某种含义的数值，则这个数值称为该结点的权。结

点的带权路径长度为：从根结点到该结点之间的路径长度与该结点的权的乘积

3) 树的带权路径长度：树的带权路径长度规定为所有叶子结点的带权路径长度之和，记为 WPL(weighted path

扫描二维码关注公众号，回复： 12878161 查看本文章

length) ,权值越大的结点离根结点越近的二叉树才是最优二叉树。

4) WPL 最小的就是赫夫曼树

3 赫夫曼树创建思路图解

给你一个数列 {13, 7, 8, 3, 29, 6, 1}，要求转成一颗赫夫曼树.

 思路分析(示意图)：

{13, 7, 8, 3, 29, 6, 1}

构成赫夫曼树的步骤：

1) 从小到大进行排序, 将每一个数据，每个数据都是一个节点，每个节点可以看成是一颗最简单的二叉树

2) 取出根节点权值最小的两颗二叉树

3) 组成一颗新的二叉树, 该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和

4) 再将这颗新的二叉树，以根节点的权值大小再次排序，不断重复 1-2-3-4 的步骤，直到数列中，所有的数

据都被处理，就得到一颗赫夫曼树

5) 图解:

4 赫夫曼树的代码实现

package huffmanTree;

import java.util.ArrayList;
import java.util.Collections;

public class HuffmanTree {

    public static void main(String[] args) {
        int[] arr = {13, 7, 8, 3, 29, 6, 1};
        
        Node createHuffmanTree = createHuffmanTree(arr);
        
        preOrder(createHuffmanTree);
        
    }
     
    // 前序遍历方法
    public static void preOrder(Node root) {
        if(root != null) {
            root.preOrder();
        } else {
            System.out.println("空树！");
        }
    }
    
    // 创建哈夫曼树
    public static Node createHuffmanTree(int[] arr) {
        // 1 遍历arr数组
        // 2 将arr的每个元素构成一个Node
        // 3 将Node放入ArrayList
        ArrayList<Node> nodes = new ArrayList<Node>();
        for (int value: arr) {
            nodes.add(new Node(value));
        }
        
        while(nodes.size() > 1) {
            Collections.sort(nodes);
            
//            System.out.println(nodes.toString());
            
            // 取出根节点权值最小的两个二叉树
            Node leftNode = nodes.get(0);
            Node rightNode = nodes.get(1);
            
            // 构建新二叉树
            Node parent = new Node(leftNode.value + rightNode.value);
            parent.left = leftNode;
            parent.right = rightNode;
            // 删除处理过的节点
            nodes.remove(leftNode);
            nodes.remove(rightNode);
            // parent加入List
            nodes.add(parent);
            
//            Collections.sort(nodes);
//            System.out.println(nodes.toString());
        }
        // 返回root
        return nodes.get(0);
    }
}

// 创建节点
class Node implements Comparable<Node>{
    int value;
    Node left;
    Node right;
    
    public void preOrder() {
        System.out.println(this);
        if(this.left != null) {
            this.left.preOrder();
        }
        if(this.right != null) {
            this.right.preOrder();
        }
    }
    
    public Node(int value) {
        this.value = value;
    }
    
    @Override
    public String toString() {
        return "Node [value= " + value + "]";
    }

    @Override
    public int compareTo(Node o) {
        return this.value - o.value;
    }
}

赫夫曼编码

1 基本介绍

1) 赫夫曼编码也翻译为

哈夫曼编码(Huffman Coding)，又称霍夫曼编码，是一种编码方式, 属于一种程序算法

2) 赫夫曼编码是赫哈夫曼树在电讯通信中的经典的应用之一。

3) 赫夫曼编码广泛地用于数据文件压缩。其压缩率通常在 20%～90%之间

4) 赫夫曼码是可变字长编码(VLC)的一种。Huffman 于 1952 年提出一种编码方法，称之为最佳编码

2 原理剖析

 通信领域中信息的处理方式 1-定长编码

通信领域中信息的处理方式 2-变长编码

通信领域中信息的处理方式 3-赫夫曼编码

步骤如下：

传输的字符串

1) i like like like java do you like a java

2) d:1 y:1 u:1 j:2 v:2 o:2 l:4 k:4 e:4 i:5 a:5

:9 // 各个字符对应的个数

3) 按照上面字符出现的次数构建一颗赫夫曼树, 次数作为权值

步骤：

构成赫夫曼树的步骤：

1) 从小到大进行排序, 将每一个数据，每个数据都是一个节点，每个节点可以看成是一颗最简单的二叉树

2) 取出根节点权值最小的两颗二叉树

3) 组成一颗新的二叉树, 该新的二叉树的根节点的权值是前面两颗二叉树根节点权值的和

4) 再将这颗新的二叉树，以根节点的权值大小再次排序，不断重复 1-2-3-4 的步骤，直到数列中，所有的数据都被处理，

就得到一颗赫夫曼树

4) 根据赫夫曼树，给各个字符,规定编码 (前缀编码)，向左的路径为 0 向右的路径为 1 ，编码

如下:

o: 1000

u: 10010 d: 100110 y: 100111 i: 101

a : 110

k: 1110

e: 1111

j: 0000

v: 0001

l: 001

: 01

5) 按照上面的赫夫曼编码，我们的"i like like like java do you like a java"

字符串对应的编码为 (注

意这里我们使用的无损压缩)

10101001101111011110100110111101111010011011110111101000011000011100110011110000110

01111000100100100110111101111011100100001100001110 通过赫夫曼编码处理长度为 133

6）长度为： 133

说明:

原来长度是 359 , 压缩了 (359-133) / 359 = 62.9%

此编码满足前缀编码, 即字符的编码都不能是其他字符编码的前缀。不会造成匹配的多义性

赫夫曼编码是无损处理方案

注意事项

注意, 这个赫夫曼树根据排序方法不同，也可能不太一样，这样对应的赫夫曼编码也不完全一样，但是 wpl 是

一样的，都是最小的, 最后生成的赫夫曼编码的长度是一样，比如: 如果我们让每次生成的新的二叉树总是排在权

值相同的二叉树的最后一个，则生成的二叉树为:

3 最佳实践-数据压缩(创建赫夫曼树)

将给出的一段文本，比如 "i like like like java do you like a java" ，根据前面的讲的赫夫曼编码原理，对其进行数

据压缩处理，形式如：

"1010100110111101111010011011110111101001101111011110100001100001110011001111000011001111000100100100

110111101111011100100001100001110

步骤：根据赫夫曼编码压缩数据的原理，需要创建 "i like like like java do you like a java" 对应的赫夫曼树

思路：前面已经分析过了，而且我们已然讲过了构建赫夫曼树的具体实现。

代码实现：

package com.lin.HuffmanCode_0314;

import java.util.ArrayList;
import java.util.Collections;
import java.util.HashMap;
import java.util.List;
import java.util.Map;

public class HuffmanCode {

    public static void main(String[] args) {
        
        String content = "i like like like java do you like a java";
        byte[] contentBytes = content.getBytes();
        System.out.println(contentBytes.length); // 40
        
        List<Node> nodes = getNodes(contentBytes);
        System.out.println(nodes);
        
        // 创建哈夫曼树
        System.out.println("哈夫曼树");
        Node createHuffmanTree = createHuffmanTree(nodes);
        
        preOrder(createHuffmanTree);
        
    }
    
    /**
     * 
     * @Description:生成赫夫曼树对应的赫夫曼编码<br>
     *                 思路：将赫夫曼编码存放在Map< 
     * @author LinZM  
     * @date 2021-3-14 21:09:30 
     * @version V1.8
     */
    
    // 前序遍历
    private static void preOrder(Node root){
        if(root != null) {
            root.preOrder();
        } else {
            System.out.println("空树！");
        }
    }
    /**
     * 
     * @Description: 
     * @author LinZM  
     * @date 2021-3-14 20:45:23 
     * @version V1.8
     * @param bytes接收字节数组
     * @param 
     */
    private static List<Node> getNodes(byte[] bytes){
        // 1 创建一个ArrayList
        ArrayList<Node> nodes= new ArrayList<Node>();
        
        // 遍历bytes，统计每一个byte出现的次数->map[key, value]
        Map<Byte, Integer> counts = new HashMap();
        for(byte b: bytes) {
            Integer count = counts.get(b);    // 
            if(count == null) {    // Map中还没有这个字符数据, 第一次
                counts.put(b, 1);
            } else {
                counts.put(b, count + 1);
            }
        }
        // 把每个键值对转成一个Node对象， 并加入到nodes集合
        for(Map.Entry<Byte, Integer> entry: counts.entrySet()) {
            nodes.add(new Node(entry.getKey(), entry.getValue()));
        }
        return nodes;
    }
    
    // 通过List创建赫夫曼树
    private static Node createHuffmanTree(List<Node> nodes) {
        while(nodes.size() > 1) {
            Collections.sort(nodes);
            
            Node leftNode = nodes.get(0);
            Node rightNode = nodes.get(1);
            
            Node parent = new Node(null, leftNode.weight + rightNode.weight);
            
            parent.left = leftNode;
            parent.right = rightNode;
            
            nodes.remove(leftNode);
            nodes.remove(rightNode);
            
            nodes.add(parent); 
        }
    return nodes.get(0);
    }
    
    
}

class Node implements Comparable<Node>{
    Byte data;// 存放数据本身
    int weight; // 权值，字符出现的次数
    Node left;
    Node right;

    public Node(Byte data, int weight) {
        this.data = data;
        this.weight = weight;
    }

    @Override
    public int compareTo(Node o) {
        // TODO Auto-generated method stub
        return this.weight - o.weight;
    }
    
    @Override
    public String toString() {
        return "Node [data = " + data + " weight= " + weight + "]";
    }
    
    // 前序遍历
    public void preOrder() {
        System.out.println(this);
        if(this.left != null) {
            this.left.preOrder();
        }
        if(this.right != null) {
            this.right.preOrder();
        }
    }
}

Java 树结构实际应用 二（哈夫曼树和哈夫曼编码）

猜你喜欢

Java 树结构实际应用二（哈夫曼树和哈夫曼编码）