java集合深入理解(五):HashMap、HashTable、TreeMap的底层源码分析和对比

(一)Map方法概述

首先先看一下官方对Map接口的解释,《Java Platform SE 8》:

An object that maps keys to values. A map cannot contain duplicate keys; each key can map to at most one value.

Map是一个通过键值对保存的对象,一个map只能由一个key,但是一个key可以有多个value。

Map的使用很简单,

1.1 Map的几个常用方法

通过代码展示一下Map中常用的方法:

public class MapTest {
    public static void main(String[] args) {
        Map map=new HashMap();
        //添加 put(key,value)
        map.put("a1",1);
        map.put("a2",1);
        map.put(null,1);
        System.out.println(map);
        //删除 remove(key)
        map.remove("a2");
        System.out.println(map);
        //是否包含 key value
        //containsKey(key)  containsValue(value)
        System.out.println(map.containsKey("a1"));
        System.out.println(map.containsValue("1"));
        //获取数据 get(key)
        System.out.println(map.get("a1"));
        //获取大小 size()
        System.out.println(map.size());
        //是否为空 isEmpty()
        System.out.println(map.isEmpty());
        //获取所有的关系 entrySet()
        System.out.println(map.entrySet());
        //获取所有的key keySet()
        System.out.println(map.keySet());
        //获取所有的value values()
        System.out.println(map.values());
    }
}

(二)HashMap的特点

HashMap底层是一个哈希表,以数组加链表的形式存储值。HashMap具有以下特点:

1.HashMap允许key和value为空

2.HashMap是线程不安全的

3.HashMap的初始容量为16,负载因子大小为0.75

4.在jdk7.0中,底层是数组加链表;在jdk8.0中,底层是数组加链表加红黑树(这一点在后面会重点讲一下)

(三)HashMap的源码分析

通过代码断点的方法逐个添加元素,单步观察代码执行步骤,首先进入HashMap的构造方法:

public HashMap() {
    this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
}

该构造方法把负载因子设置为0.75,负载因子的意思是当存入的数据大于总容量的0.75倍时,就扩容。构造方法结束后进入put方法

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

put方法直接返回putVal()方法,putVal方法的第一个参数是根据key计算的一个哈希值,可以看一下这个hash方法:通过hash运算和异或操作得到hash值并返回

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

接下来就进入了比较重要的putVal方法:

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    //查看此时table的容量(即哈希表数组部分的长度),如果为空(第一次进入),则进入resize()方法
    //resize()是个初始化或扩容方法,初始化成16或扩容2倍
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    //根据此时数组的长度n和计算的hash值算出索引
    //计算出的索引一定在0~n-1之间
   //如果该索引位置没有元素,则直接将元素添加进入
   if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
   //如果该索引位置存在元素,执行以下代码块    
   else {
        Node<K,V> e; K k;
        //如果该元素和要保存的元素相同,则覆盖
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        //如果不相同,并且是树状结构,则按树状结构的方式添加元素
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        //如果是链状结构,则按照链表的方式添加元素
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    //判断容量是否超过临界值,如果超过了就2倍扩容
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

源码分析:

HashMap中维护了Node类型的数组table,当HashMap创建对象时,设置负载因子为0.75,table还是null。

当第一次添加元素时,将table的容量设置为16,临界值设置为12

每次添加元素调用putVal方法:

1.将key的hash值和table容量-1进行与运算,得到索引值

2.判断该存放位置上是否有元素,如若没有元素则直接放上去;如果该索引位置已存在元素,则继续判断

3.如果该位置的元素和添加元素相等,则直接覆盖,如果不相等,则继续判断是链表结构还是树状结构,按照相对应的方式添加。

如果添加的数量大于临界值,执行resize方法对容量双倍扩容。并打乱顺序重新排列

(四)HashMap在JDK7和JDK8中的区别

前面一直提到树状结构和红黑树,这是HashMap在JDK7和JDK8之间最大的区别。数组+链表的结构下,如果一个索引后跟着的链表数量很多时,会很影响查找效率,因此在JDK8中,HashMap当满足某种条件(链表长度大于8,table容量大于64)时,会将链表转化为红黑树结构,提高效率。

截取一段源码:当链表长度大于等于(TREEIFY_THRESHOLD - 1)时,这个值是7,进入treeifyBin方法。链表长度大于等于7,再加上数组上的一个元素,一共是8个元素。

if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
    treeifyBin(tab, hash);

进入treeifyBin方法:

final void treeifyBin(Node<K,V>[] tab, int hash) {
    int n, index; Node<K,V> e;
    //如果进入treeifyBin但是table的容量小于64,则执行resize扩容并重新打乱
    if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
        resize();
    //链表长度大于8,table容量大于64,转化成红黑树
    else if ((e = tab[index = (n - 1) & hash]) != null) {
        TreeNode<K,V> hd = null, tl = null;
        do {
            TreeNode<K,V> p = replacementTreeNode(e, null);
            if (tl == null)
                hd = p;
            else {
                p.prev = tl;
                tl.next = p;
            }
            tl = p;
        } while ((e = e.next) != null);
        if ((tab[index] = hd) != null)
            hd.treeify(tab);
    }
}

如果进入treeifyBin但是table的容量小于64,则执行resize扩容并重新打乱。所以并非容量大于临界容量才会扩容。

JDK7和JDK8区别总结:

1.初始化对象时,JDK7直接初始化对象容量为16,JDK8仅仅初始化负载因子为0.75

2.table类型:JDK7是Entry(映射key和value),JDK8是Node类型(为了红黑树)

3.底层结构:JDK7数组+链表,JDK8数组+链表+红黑树(链表长度大于8,table容量大于64

(四)HashMap和HashTable的对比

HashMap和HashTable的处境有点像Vector和ArrayList,HashTable现在很少使用,就用一个表格来总结它和HashMap的区别

 

底层结构

版本

线程安全(同步)

允许null

HashMap

哈希表

1.2

不安全

允许键值为null

HashTable

哈希表

1.0

安全

不允许键值null

(五)TreeMap的介绍

A Red-Black tree based NavigableMap implementation. The map is sorted according to the natural ordering of its keys, or by a Comparator provided at map creation time, depending on which constructor is used.

根据官方文档的介绍,TreeMap底层是一个红黑树,map是根据keys进行自然排序或者定制排序。

自然排序和定制排序的用法和TreeSet类似。

使用自然排序:需要在类中继承Comparable接口,并重写compareTo方法。

public class Book implements Comparable{
    private String name;
    private float price;
    public Book(String name, float price){
        this.name=name;
        this.price=price;
    }
    //.........
    @Override
    public int compareTo(Object o) {
        Book book= (Book) o;
        return Double.compare(book.price,this.price);
    }
}

使用定制排序:需要在创建TreeMap对象时传入一个Comparator接口,并实现里面的compare方法。

TreeMap map=new TreeMap(new Comparator() {
    @Override
    public int compare(Object o1, Object o2) {
        Book book1= (Book) o1;
        Book book2= (Book) o2;
        return Double.compare(book1.getPrice(),book2.getPrice());
    }
});

(六)总结

HashMap绝对是Map中的重点,也是据我所知面试中问到最多的集合知识。因此有条件的话打开源码自己单步调试一遍。HashTable、TreeMap就算没有看过代码但是也要了解各自的特点。

发布了62 篇原创文章 · 获赞 742 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/qq_41973594/article/details/104072361