HashMap源码解读(jdk1.8)

本文基于jdk1.8解读HashMap关键代码

HashMap是非线程安全的，在多线程环境下要使用ConcurrentHashMap

存储结构

HashMap的存储结构是数组 + 链表 + 红黑树，当链表的长度大于等于8时，链接转成红黑树

初始化

HashMap初始容量是16，默认负载因子是0.75

当然初始化的时候也可以传入指定容量大小。那么是不是传入多少，初始化的容量就是多少呢？

/**
 * The default initial capacity - MUST be a power of two.
 */
static final int DEFAULT_INITIAL_CAPACITY = 1<< 4; // aka 16

这里的注释说明，容量必须是2的N次方

传入的默认大小会经过重新计算，转成大于指定值的第一个2的次方数

看看下面这个重新计算大小的方法：

/**
 * Returns a power of two size for the given target capacity.
 */
static final int tableSizeFor(int cap) {
// 这里 cap - 1 是为了当传入正好是2的次方时，保持原值
// 例如，传入 8时，初始值是就是8 ，不会变成 16 
    int n = cap - 1;
// 右移1位，并且和原值按位或，得到的结果是高2位都是1
    n |= n >>> 1;
// 右移2位，并且和原值按位或，得到的结果是高4位都是1
    n |= n >>> 2;
// 右移4位，并且和原值按位或，得到的结果是高8位都是1
    n |= n >>> 4;
// 右移8位，并且和原值按位或，得到的结果是高16位都是1
    n |= n >>> 8;
// 右移16位，并且和原值按位或，得到的结果是高32位都是1
    n |= n >>> 16;
// 如果真的有这么大的值，走到这行已经超出最大容量了
// 经过上面5步后，得到的值转成二进制必然都是1，经过n+1后得到的值正好就是2的次方（最高位是1，后面全是0）
    return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;

}

这里用到的操作符是>>>，表示无符号右移，也叫逻辑右移，即若该数为正，则高位补0，而若该数为负数，则右移后高位同样补0

另外， >>表示右移，如果该数为正，则高位补0，若为负数，则高位补1

存入值

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

存入值的时候，map对应的key是存入key对应的hasCode和它的高16位进行异或，这么做的目的是为了存入数组中的元素分别更加均匀些

下面看看putVal：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

1、数组下标计算：i = (n - 1) & hash

n是数组容量，在初始化的时候强制转成2的次方，那么n-1转成二进制就全是1（如，15 = 1111）；所以，n-1 按位与任何值，得到的数据肯定是小于n-1

2、如果得到的数据下标位置已经有元素，那么添加在对应的链表下面

3、如果对应的链表长度大于8，链表转红黑树

hash碰撞

不同的key，经过hash后，得到的数组下标一致，称为hash碰撞；在为了尽量降低hash碰撞，HashMap采用了高位异或，然后和（n-1）进行按位或得到具体数组下标

扩容

HashMap的最大容量是2^30

默认的负载因子是0.75，意思是在数量大于容量的75%的时候，HashMap就会进行一次扩容，每次扩容都是翻倍

扩容之后，数组的下标要重新计算，原数组的元素也必须一个个copy赋值过来，当然原结构中的红黑树/链表等也必须重新计算

具体扩容方法如下：

如果元素是单个节点，重新计算数组下标

如果元素是链表，将链表拆分为2，低位链表在原下标位置，高位链表移动到原下标+原数组容量的位置上

如果元素是红黑树，拆分原理和链表一样，只是多判断一下新的红黑树元素数量，如果数量<=6，新的红黑树转成链表

注意：数组的长度就是HashMap的最大容量，HashMap中元素的总数不会超过数组的长度。
理想情况是：一个元素占一个数组下标，没有链表也没有红黑树

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
        Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

HashMap成环

jdk1.7之前HashMap链表是头插法，在并发情况下，HashMap扩容时，a元素的next会指向b，b元素的next有可能会指向a，造成环形；遍历的时候就会死循环

jdk1.8做了调整，改成尾插法

链表转红黑树

链表的长度大于等于8时，链表会转成红黑树

红黑树的节点数小于等于6时，会转成链表；红黑树转链表都是在数组扩容，重新计算hash值的时候发生

取值

取值方法比较简单，采用同样的方法算出数组下标

如果所在数组位置是个链表，逐个比较元素的key值

如果所在数组位置是个红黑树，因为红黑树是有序的，所以比较hash值查找，然后再比较元素的key值

final Node<K,V> getNode(int hash, Object key) {
    Node<K,V>[] tab; Node<K,V> first, e; int n; K k;
    if ((tab = table) != null && (n = tab.length) > 0 &&
        (first = tab[(n - 1) & hash]) != null) {
        if (first.hash == hash && // always check first node
            ((k = first.key) == key || (key != null && key.equals(k))))
            return first;
        if ((e = first.next) != null) {
            if (first instanceof TreeNode)
                return ((TreeNode<K,V>)first).getTreeNode(hash, key);
            do {
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    return e;
            } while ((e = e.next) != null);
        }
    }
    return null;
}

查找红黑树

final TreeNode<K,V> find(int h, Object k, Class<?> kc) {
    TreeNode<K,V> p = this;
    do {
        int ph, dir; K pk;
        TreeNode<K,V> pl = p.left, pr = p.right, q;
        if ((ph = p.hash) > h)
            p = pl;
        else if (ph < h)
            p = pr;
        else if ((pk = p.key) == k || (k != null && k.equals(pk)))
            return p;
        else if (pl == null)
            p = pr;
        else if (pr == null)
            p = pl;
        else if ((kc != null ||
                  (kc = comparableClassFor(k)) != null) &&
                 (dir = compareComparables(kc, k, pk)) != 0)
            p = (dir < 0) ? pl : pr;
        else if ((q = pr.find(h, k, kc)) != null)
            return q;
        else
            p = pl;
    } while (p != null);
    return null;
}