解决哈希冲突的三种方法

拉链法

HashMap是一个数组，数组中的每个元素是链表。

put元素进去的时候，会通过计算key的hash值来获取到一个index，根据index找到数组中的位置，进行元素插入。

当新来的元素映射到冲突的数组位置时，只需要插入到对应链表位置即可，新来的元素是插入到链表的头部。

Java中HashMap是利用“拉链法”处理HashCode的碰撞问题。在调用HashMap的put方法或get方法时，都会首先调用hashcode方法，去查找相关的key，当有冲突时，再调用equals方法。hashMap基于hasing原理，我们通过put和get方法存取对象。当我们将键值对传递给put方法时，他调用键对象的hashCode()方法来计算hashCode，然后找到bucket（哈希桶）位置来存储对象。当获取对象时，通过键对象的equals()方法找到正确的键值对，然后返回值对象。

HashMap使用链表来解决碰撞问题，当碰撞发生了，对象将会存储在链表的下一个节点中。hashMap在每个链表节点存储键值对对象。当两个不同的键却有相同的hashCode时，他们会存储在同一个bucket位置的链表中。键对象的equals()来找到键值对

优点

拉链法处理冲突简单，且无堆积现象，即非同义词决不会发生冲突，因此平均查找长度较短
由于拉链法中各链表上的结点空间是动态申请的，故它更适合于造表前无法确定表长的情况
开放定址法为减少冲突，要求装填因子α较小，故当结点规模较大时会浪费很多空间。而拉链法中可取α≥1，且结点较大时，拉链法中增加的指针域可忽略不计，因此节省空间
在用拉链法构造的散列表中，删除结点的操作易于实现。只要简单地删去链表上相应的结点即可

缺点

指针需要额外的空间，故当结点规模较小时，开放定址法较为节省空间，而若将节省的指针空间用来扩大散列表的规模，可使装填因子变小，这又减少了开放定址法中的冲突，从而提高平均查找速度

开放地址法

开放地址法有个非常关键的特征，就是所有输入的元素全部存放在哈希表里，也就是说，位桶的实现是不需要任何的链表来实现的，换句话说，也就是这个哈希表的装载因子不会超过1。它的实现是在插入一个元素的时候，先通过哈希函数进行判断，若是发生哈希冲突，就以当前地址为基准，根据再寻址的方法（探查序列），去寻找下一个地址，若发生冲突再去寻找，直至找到一个为空的地址为止。所以这种方法又称为再散列法。

常用的探查序列的方法

线性探查

冲突发生的时候顺序查看表中的下一个单元，直到找到空的元素或者查遍全表

二次探查

发生冲突的时候在表的左右进行跳跃式探查，比较灵活，即先探测下一位，再探测上一位，然后探测下两位

尾随机探测

建立一个伪随机数发生器（如i=(i+P)%m）,生成一个位随机序列，并给定一个随机数做起点，每次去加这个伪随机数++就可以了

再散列法

发生冲突，就再散列，知道不发生冲突

缺点：每次冲突就需要重新散列，计算成本增加

AlexNii

发布了37 篇原创文章 · 获赞 7 · 访问量 3624

私信关注