1、开放地址法有一个公式: m是hash表长度,di 是产生冲突的时候的增量序列
fi(key) = (f(key)+di) MOD m;
找到 fi(key) 位置空的放入此位置 ,当达到表尾m-1时,又从0开始探查.
a.线性探测法 (di=0,1,2,3,......,m-1)
b.二次探测法(线性补偿探测法) di=i^2,di=- (i^2); i=0,1,2,3,(m-1)/2
c.随机探测 di 是一组伪随机数列 使用一个确定性的算法计算出来的似乎是随机的数序,因此伪随机数实际上并不随机 比如电脑上的时间作为计算伪随机数的开始值。
2、再哈希法
当发生冲突时,使用第二个、第三个、哈希函数计算地址,直到无冲突时。缺点:计算时间增加。
比如字符串安装第一个字母进行哈希,如果产生冲突可以按照第二个字母进行哈希,再冲突,第三个,直到不冲突为止
3、链地址法
将所有关键字为同义词的记录存储在同一线性链表中。如下:
4、建立一个公共溢出区
假设哈希函数的值域为[0,m-1],则设向量HashTable[0..m-1]为基本表,另外设立存储空间向量OverTable[0..v]用以存储发生冲突的记录。
经过以上方法,基本可以解决掉hash算法冲突的问题。
注:之所以会简单得介绍了hash,是为了更好的学习lzw算法,学习lzw算法是为了更好的研究gif文件结构,最后,我将详细的阐述一下gif文件是如何构成的,如何高效操作此种类型文件。