分析HashMap1.7中的hash方法

    static int hash(int h) {
        h ^= (h >>> 20) ^ (h >>> 12);
        return h ^ (h >>> 7) ^ (h >>> 4);
    }

我们知道,对于HashMap的table而言,数据的分布要均匀(最好下标只有一个元素,这样可以直接找到)不能太紧,也不能太松。太紧导致查询速度慢,太松则浪费空间。计算hash值后,如何保证table的元素均匀分布呢?HashMap使用indexFor方法

    static int indexFor(int h, int length) {
        return h & (length-1);
    }

hashMap底层数组的长度为2的n次方,在构造函数中: capacity <<=1;这样总能保证HashMap底层数组的长度为2的n次方。当length为2的n次方时,h & (length - 1)就相当于对length取模,而且速度要快。并且能均匀分布table数据和充分利用空间。

假设length 为16 (2^n)和15,h为5,6,7

table1_thumb[3]

当length = 15时, h为6 ,7会产生碰撞。这样6,7就会在这个角标为6的位置上创建一个链表。这样会导致查询速度降低。我们看看h为0-15时的结果。

table2_thumb[16]

可以看到,发生了8次碰撞,同时空间浪费严重。1.3.5.7.9.11.13.15处没记录。原因在于在与14进行&运算时,得到的最后一位永远都是0,即000.,0011,0101,0111,1001,1011,1101,1111处不可能存储数据。空间减少,碰撞加大。

所以当length为2^n时,不同的hash值发生的碰撞的概率比较小。这样会使得数据在table数组中分布较均匀,查询速度也快。

扫描二维码关注公众号,回复: 4778359 查看本文章

猜你喜欢

转载自blog.csdn.net/kekekeqi/article/details/85771822