哈夫曼树

2016.08.20

上课内容：哈夫曼树

哈夫曼树（霍夫曼树）又称为最优二叉树.

1、路径和路径长度

在一棵树中，从一个结点往下可以达到的孩子或孙子结点之间的通路，称为路径。通路中分支的数目称为路径长度。若规定根结点的层数为1，则从根结点到第L层结点的路径长

2、结点的权及带权路径长度

若将树中结点赋给一个有着某种含义的数值，则这个数值称为该结点的权。结点的带权路径长度为：从根结点到该结点之间的路径长度与该结点的权的乘积。

3、树的带权路径长度

树的带权路径长度规定为所有叶子结点的带权路径长度之和，记为WPL

WPL=(W1*L1+W2*L2+W3*L3+...+Wn*Ln)

N个权值Wi(i=1,2,...n)构成一棵有N个叶结点的二叉树，相应的叶结点的路径长度为Li(i=1,2,...n)。

哈夫曼树的形式如图1所示:

父节点(parent)又分为左节点(left)和右节点(right)，其遍历方式有四种，即：前序遍历，中序遍历，后续遍历，层次遍历

图3为带权路径长度的算法，哈夫曼树的带权路径最短。

练习:找出哈夫曼树的节点和带权值

import java.util.*;  
public class HuffmanTree  
{  
    public static class Node<E>  
    {  
        E data;  
        double weight;  
        Node leftChild;  
        Node rightChild;  
        public Node(E data , double weight)  
        {  
            this.data = data;  
            this.weight = weight;  
        }  
        public String toString()  
        {  
            return "Node[数字：" + data  + " 频率：" + weight + "]";  
        }  
    }  
    public static void main(String[] args)  
    {  
        List<Node> nodes = new ArrayList<Node>();  
        nodes.add(new Node("A" , 40.0));  
        nodes.add(new Node("B" , 8.0));  
        nodes.add(new Node("C" , 10.0));  
        nodes.add(new Node("D" , 30.0));  
        nodes.add(new Node("E" , 10.0));  
        nodes.add(new Node("F" , 2.0));  
        Node root = HuffmanTree.createTree(nodes);  
        System.out.println(breadthFirst(root));  
    }  
    /** 
     * 构造哈夫曼树 
     * @param nodes 节点集合 
     * @return 构造出来的哈夫曼树的根节点 
     */  
    private static Node createTree(List<Node> nodes)  
    {  
        //只要nodes数组中还有2个以上的节点  
        while (nodes.size() > 1)  
        {  
            quickSort(nodes);  
            //获取权值最小的两个节点  
            Node left = nodes.get(nodes.size() - 1);  
            Node right = nodes.get(nodes.size() - 2);  
            //生成新节点，新节点的权值为两个子节点的权值之和  
            Node parent = new Node(null , left.weight + right.weight);  
            //让新节点作为权值最小的两个节点的父节点  
            parent.leftChild = left;  
            parent.rightChild = right;  
            //删除权值最小的两个节点  
            nodes.remove(nodes.size() - 1);  
            nodes.remove(nodes.size() - 1);  
            //将新生成的父节点添加到集合中  
            nodes.add(parent);  
        }  
        //返回nodes集合中唯一的节点，也就是根节点  
        return nodes.get(0);  
    }  
    //将指定数组的i和j索引处的元素交换  
    private static void swap(List<Node> nodes, int i, int j)  
    {  
        Node tmp;  
        tmp = nodes.get(i);  
        nodes.set(i , nodes.get(j));  
        nodes.set(j , tmp);  
    }  
    //实现快速排序算法，用于对节点进行排序。从大到小的排序  
    private static void subSort(List<Node> nodes, int start , int end)  
    {  
        //需要排序  
        if (start < end)  
        {  
            //以第一个元素作为分界值  
            Node base = nodes.get(start);  
            //i从左边搜索，搜索大于分界值的元素的索引  
            int i = start;  
            //j从右边开始搜索，搜索小于分界值的元素的索引  
            int j = end + 1;  
            while(true)  
            {  
                //找到大于分界值的元素的索引，或i已经到了end处  
                while(i < end && nodes.get(++i).weight >= base.weight);  
                //找到小于分界值的元素的索引，或j已经到了start处  
                while(j > start && nodes.get(--j).weight <= base.weight);  
                if (i < j)  
                {  
                    swap(nodes , i , j);  
                }  
                else  
                {  
                    break;  
                }  
            }  
            swap(nodes , start , j);  
            //递归左子序列  
            subSort(nodes , start , j - 1);  
            //递归右边子序列  
            subSort(nodes , j + 1, end);  
        }  
    }  
    public static void quickSort(List<Node> nodes)   
    {  
        subSort(nodes , 0 , nodes.size() - 1);  
    }  
    //广度优先遍历  
    public static List<Node> breadthFirst(Node root)  
    {  
        Queue<Node> queue = new ArrayDeque<Node>();  
        List<Node> list = new ArrayList<Node>();  
        if( root != null)  
        {  
            //将根元素入“队列”  
            queue.offer(root);  
        }  
        while(!queue.isEmpty())  
        {  
            //将该队列的“队尾”的元素添加到List中  
            list.add(queue.peek());  
            Node p = queue.poll();  
            //如果左子节点不为null，将它加入“队列”  
            if(p.leftChild != null)  
            {  
                queue.offer(p.leftChild);  
            }  
            //如果右子节点不为null，将它加入“队列”  
            if(p.rightChild != null)  
            {  
                queue.offer(p.rightChild);  
            }  
        }  
        return list;  
    }
}

哈夫曼树的应用:

在通信及数据传输中多采用二进制编码。为了使电文尽可能的缩短，可以对电文中每个字符出现的次数进行统计。设法让出现次数多的字符的二进制码短些，而让那些很少出现的字符的二进制码长一些。

在数中令左边分支去编码为0，右边编码为1，将从根节点到某个叶子节点上的各左、右分支的编码顺序排列，就得到这个叶子节点所代表的字符的二进制编码，如图4所示。

这些编码拼成的电文不会混淆，因为每个字符的编码不是其它编码的前缀，这种编码称为前缀编码。

猜你喜欢