哈希表又称作散列表,是一种多用于查找的数据结构,其本质上是一种利用空间换时间的做法,其需要事先分配足够大的内存空间,这实际上是非常浪费空间的,理想化的哈希表所有的操作时间复杂度都为 O(1),这表明其效率非常高。
其根据key值来计算出其的存储位置,查找时也是用key来算出其所在位置,要实现一个哈希表,我们要做到以下两点:
(1)尽可能理想
(2)尽可能一一对应
尽可能理想:理想化的哈希表是不存在冲突情况的,当H(key1)=H(key2),这时表明发生了冲突,尽可能的少发生冲突就是我们要做的。
尽可能一一对应:一个key对应一个地址位置,这样可以使哈希表的效率达到O(1)级,此时哈希表的操作效率最高。
一.使用k来找存储位置的方法:
(1)直接定址法
例如:
H(k)=k-1;
简单直接的算式来计算出地址
(2)数字分析法
找值中任意几位不同的数字为哈希地址,尽可能使其不冲突:
例如:
123566890
123546890
123343890
123328890
我们可以看出中间三位数互不相同,则可以用中间三位作为地址
(3)平方取中法
关键字较短时,k取平方后在使用数字分析法得出结果。
(4)折叠法
例如:123456789
789+456+123=1368,去掉进位后取368作为地址
(5)除留余数法(最常用)
H(k)=k%m;
m大于我们分配的数组空间长度
m的限制:m最好为质数,这样可以尽可能避免冲突
二.处理冲突的方法
1.开放定址法(常用)
分为:
(1)线性探测再散列
根据余数定位置,若位置上已经有元素存在,则加上增量di,再次探测定位置,如此反复,直到发现我们需要找的值为止。
(2)二次探测再散列
双向探测,增一个减一个,增1,减1,增4,减4…
(3)伪随机探测再散列
2.链地址法
如上图所示,数据存储类似于链表,同位置可放多个元素,使用链表将其链起来。搜索时通过k找到地址后遍历这些链表即可。
3.公共溢出区法
如上图所示,设置一个公共溢出区,同一位置若有多个元素需要插入,则后来的元素放入公共溢出区即可。
哈希表的C语言实现:
#include <stdio.h>
#include <malloc.h>
#include <stdlib.h>
//设置一个数组分配空间大小
#define HASHSIZE 10
//设置最小int用于初始化
#define NULLKEY -32768
int m = 0;
typedef struct
{
int* elem;
int count;
}HashTable;
//初始化哈希表
int Init(HashTable* H)
{
m = HASHSIZE;
H->count = m;
H->elem = (int*)malloc(sizeof(int) * m);
if (H->elem == nullptr)
{
printf("动态内存分配失败!");
exit(-1);
}
for (int i = 0;i < m;i++)
{
H->elem[i] = NULLKEY;
}
return 1;
}
//哈希算法
int Hash(int k)
{
//除留余数法
return k % m;
}
//根据k插入元素
void Insert(HashTable* H, int k)
{
int addr = Hash(k);
while (H->elem[addr] != NULLKEY)
{
//开放定址法
addr = (addr + 1) % m;
}
H->elem[addr] = k;
}
//搜索某个元素位置
int Search(HashTable* H, int k)
{
int addr = Hash(k);
while (H->elem[addr] != k)
{
//开放定址法
addr = (addr + 1) % m;
//addr==Hash(k)是指这个数组满了,无法再插入元素
if (H->elem[addr] == NULLKEY || addr == Hash(k))
{
return -1;
}
}
return addr;
}
//遍历哈希表
void Result(HashTable* H)
{
for (int i = 0;i < m;i++)
{
printf_s("%d\n", H->elem[i]);
}
}
//主函数调用
void main()
{
int i, j, addr;
HashTable H;
int arr[HASHSIZE] = { NULL };
Init(&H);
printf("输入关键字集合:");
for (i = 0; i < HASHSIZE; i++)
{
scanf_s("%d", &arr[i]);
Insert(&H, arr[i]);
}
Result(&H);
printf("输入需要查找的元素:");
scanf_s("%d", &j);
addr = Search(&H, j);
if (addr == -1)
printf("元素不存在\n");
else
printf("%d元素在表中的位置是:%d\n", j, addr);
}