Map之HashMap的get与put流程，及hash冲突解决方式

　　在java中HashMap作为一种Map的实现，在程序中我们经常会用到，在此记录下其中get与put的执行过程，以及其hash冲突的解决方式：

　　HashMap在存储数据的时候是key-value的键值对的形式存放的，一个key-value会创建一个Map.Entry实现类，在HashMap中该实现类分为Node和TreeNode，其中TreeNode继承了Node类，在没有hash冲突的情况下，这些Map.Entry实现类会组成数组table存放。key的hashCode值决定了该Map.Entry在table中的索引

　　HashMap的hash算法是key的hashCode异或key的hashCode无符号右移16位

　　在放入key到一定程度的时候就会出现不同的key值运算出相同的hash值，导致多个Map.Entry类存放在table同一个索引位置上，这个时候就是所谓的hash冲突。

通过观察put(key,value)方法：

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

View Code

　　我们发现，在执行过程中会首先取出table在(table.length-1)&hash(key)的值，如果该值为空，说明还没有发生hash冲突，直接new一个Node放在该索引处，

如果该值不为空，说明已经存放过相同hash值的key，继续判断两个key的equals方法是否相等，如果相等则覆盖原来的值。如果不等，则出现hash冲突。

　　在出现hash冲突时首先会判断当前的Node是否是TreeNode，如果是TreeNode则在该TreeNode上添加一个分支。如果不是，那么说明是Node类。在table中只会存在这两个Map.Entry实现类。在所有的Node都有一个next变量，当出现hash冲突时，就会将该Node的next变量赋值为要放入的新的Node，这样在多次冲突后该位置就会形成一个类似于链表的结构，当该链表长度为8时，为了提高性能，就会将该链表替换成树结构的TreeNode。

扫描二维码关注公众号，回复： 44595 查看本文章

　　以上就是HashMap解决hash冲突的方式。

　　当调用get方法时

 public V get(Object key) {
        Node<K,V> e;
        return (e = getNode(hash(key), key)) == null ? null : e.value;
    }

　　会通过key的hash值获取table中的Node，并通过key的equals方法来确定要取的Node，在返回Node的value值。

　　通过HashMap的存储结构可以发现当我们遍历HashMap时通过entrySet方法性能会高一点，因为它直接返回了存储的Map.Entry类，而遍历key方式是通过遍历Map.Entry取出key，我们在调用get(key)方法时又会去取一次Entry，所以性能会比较低

Map之HashMap的get与put流程，及hash冲突解决方式

猜你喜欢