查找 - 计算式查找法 - 哈希法

1、哈希函数的构造方法

> 数字分析法

假设关键字 Key 为 8 位十进制整数:

① 确定哈希表的长度,示例:100,即地址空间为 0 ~ 99

② 确定 “取值比较均匀分布” 的位置,示例:第四位和第七位

③ 则哈希函数为 H(Key) = H(ABCDEFGH) = DG

④ 示例: H(81301367) = 06、 H(81346532) = 43

> 平方取中法

假设关键字 Key 为大写英文字符串:

① 确定哈希表的长度,示例:1000,即地址空间为 0 ~ 999

② 指定内部编码,示例: A-01, B-02, C-03 。。。 Z-20

③ 计算内部编码平方,取中间三位作为哈希值

关键字 内部编码 内部编码的平方 H(Key)关键字的哈希地址
KEKA 11052501 122157 778 355001 778
KYAB 11250102 126564 795 010404 795
AKEY 01110525 001233 265 775625 315

> 分段叠加法

假设关键字 Key 为超长的整数,示例 12360324711202065 :

① 确定哈希表的长度,示例:1000,即地址空间为 0 ~ 999

② 从左到右,分割成 N 个三位数,右侧不足三位的舍弃,示例:123 603 247 112 020

③ 将 N 个三位数相加,结果超过三位数的左侧舍弃,示例:

H(Key) = H(12360324711202065) = 123 + 603 + 247 +112 + 020 = 1105 % 1000 = 105

> 除留余数法

假设哈希表长 m, p 为小于等于 m 的最大素数,哈希函数为:

H(Key) = k % p

示例:key 为 80, 表长 13,最大素数 13,H(Key) = H(80) = 80 % 13 = 5

> 伪随机数法

采用一个伪随机函数作为哈希函数, 即 H(key) = random(key)

2、处理冲突的方法

> 开放定址法(再散列法)

关键字 key 的初始哈希地址 h0 = H(key) 产生冲突时,以 h0 为基础,产生另一个地址 h1,若 h1 仍然冲突,再以 h0 为基础,产生哈希地址 h2,直到不冲突为止!

初始哈希地址:H0 = H(key)
冲突哈希地址:Hi = (H0 + Di) % m i = 1,2,...,n

① 线性探测再散列

Di = 1,2,3,...,m-1

② 二次探测再散列

Di = 1^2, -1^2, 2^2, -2^2,.... k^2, -k^2 (k <= m/2)

③ 伪随机探测再散列

Di = 伪随机数序列

查找结束条件:直到找到一个空单元或者查遍全表

> 再哈希法

同时构造多个不同的哈希函数,当哈希发生冲突时,使用下一个哈希函数,直到不再产生冲突。

这种方法不易产生聚焦,但增加了计算时间!

> 链地址法

产生的哈希冲突加入链表

3、Java 中哈希值的计算规则

① 创建 int result,赋值非0

② 对于在 equals() 方法中测试的每个字段 f,通过以下方式计算哈希值 c

  • boolean(f ? 0 : 1)
  • bytecharshort 或 int(int)f
  • long(int)(f ^ (f >>> 32))
  • floatFloat.floatToIntBits(f)
  • doubleDouble.doubleToLongBits(f) 并像 long 型一样处理返回结果
  • object: 使用 hashCode() 方法,若为 null 返回 0
  • array: 将每个字段视为单独的元素并以递归方式计算哈希值,并按照下面所述方式组合最终结果

③ 组合哈希值 c 和 result

result = 37 * result + c

④ 返回 result

猜你喜欢

转载自blog.csdn.net/m0_37609579/article/details/80013975