Hash算法的简单理解

一开始听到Hash我单纯的以为他只是一个算法,看了一些文章以后才知道原来它是一类算法的统称。

提到Hash函数就要先说Hash表,看了Hash表的定义,感觉和我在python中学的字典很类似,不过查了以后发现还是有一些区别的。

Hash函数是一个优化函数,用来加速存储数据,原理是大范围映射到小范围上,从而节省空间,使数据便于存储。

碰撞:两个hash对象返回了相同的计算值。

处理方法:

1.开放寻址法:Hi=(H(key) + di) MOD m,i=1,2,…,k(k<=m-1),其中H(key)为散列函数,m为散列表长,di为增量序列,可有下列三种取法:

1). di=1,2,3,…,m-1,称线性探测再散列;

2). di=1^2,(-1)^2,2^2,(-2)^2,(3)^2,…,±(k)^2,(k<=m/2)称二次探测再散列;

3). di==伪随机数序列,称伪随机探测再散列。

2. 再散列法:Hi=RHi(key),i=1,2,…,k RHi均是不同的散列函数,即在同义词产生地址冲突时计算另一个散列函数地址,直到冲突不再发生,这种方法不易产生“聚集”,但增加了计算时间。

3. 链地址法(拉链法)

4. 建立一个公共溢出区

常见的hash函数构造方法:

1.直接寻址法:取关键字或关键字的某个线性函数值为散列地址。即H(key)=key或H(key) = a·key + b,其中a和b为常数(这种散列函数叫做自身函数)

2. 数字分析法

3. 平方取中法

4. 折叠法

5. 随机数法

6. 除留余数法:取关键字被某个不大于散列表表长m的数p除后所得的余数为散列地址。即 H(key) = key MOD p,p<=m。不仅可以对关键字直接取模,也可在折叠、平方取中等运算之后取模。对p的选择很重要,一般取素数或m,若p选的不好,容易产生同义词。

猜你喜欢

转载自blog.csdn.net/HYbuery/article/details/82691860
今日推荐