HashMap原理和实现

原理

我们都知道怎么使用goLang中的map来存储键值对类型的数据，但是它的内部实现是怎么样的？

其实map是一种HashMap，表面上看它只有键值对结构，实际上在存储键值对的过程中涉及到了数组和链表。HashMap之所以高效，是因为其结合了顺序存储(数组)和链式存储(链表)两种存储结构。数组是HashMap的主干，在数组下有有一个类型为链表的元素。

这是一个简单的HashMap的结构图：

HashMap结构

当我们存储一个键值对时，HashMap会首先通过一个哈希函数将key转换为数组下标，真正的key-value是存储在该数组对应的链表里。

HashMap的数组往往是有限的，那当要存储的键值对很多数组不够或者两个键值对哈希运算后的值相同时，不就会有不同的键值对存储在同一个数组下吗？是的，这个就叫做哈希碰撞。当发生哈希碰撞时，键值对就会存储在该数组对应链表的下一个节点上。

尽管这样，HashMap的操作效率也是很高的。当不存在哈希碰撞时查找复杂度为O(1)，存在哈希碰撞时复杂度为O(N)。所以，但从性能上讲HashMap中的链表出现越少，性能越好；当然，当存储的键值对非常多时，从存储的角度链表又能分担一定的压力。

代码实现

KVMap

首先，HashMap存储的是键值对，所以需要一个键值对类型。

//链表结构里数据的数据类型键值对typeKVstruct{ KeystringValuestring}

LinkNode

键值对又是主要存储在链表里的，所以需要一个链表类。

//链表结构typeLinkNodestruct{//节点数据Data KV//下一个节点NextNode *LinkNode}//创建只有头结点的链表funcCreateLink()*LinkNode{//头结点数据为空是为了标识这个链表还没有存储键值对varlinkNode = &LinkNode{KV{"",""},nil}returnlinkNode}

当发生哈希碰撞时，键值对会存储在新建的链表节点上。这里需要一个添加节点的功能，我们这里采用尾插法添加节点。

//尾插法添加节点,返回链表总长度func(link *LinkNode)AddNode(dataKV) int {varcount=0//找到当前链表尾节点tail := linkfor{count+=1iftail.NextNode==nil{break}else{ tail = tail.NextNode} }varnewNode = &LinkNode{data,nil} tail.NextNode= newNodereturncount+1}

HashMap

接下来，就是猪脚HashMap登场了。

//HashMap木桶(数组)的个数constBucketCount =16typeHashMapstruct{//HashMap木桶Buckets [BucketCount]*LinkNode}//创建HashMapfuncCreateHashMap()*HashMap{ myMap := &HashMap{}//为每个元素添加一个链表对象fori :=0; i < BucketCount ; i++ { myMap.Buckets[i] = CreateLink() }returnmyMap}

我们需要一个哈希散列算法，将key转化为一个0-BucketCount的整数，作为存放它的数组的下标。这里这个散列算法，应尽可能随机地使新增的键值对均匀地分布在每个数组下。

一般像go的map和Java的HashMap都会有一个复杂的散列算法来达到这个目的，我们这里只是为了讲HashMap原理，暂且就用一个简单的方法来求出下标。

//自定义一个简单的散列算法，它可以将不同长度的key散列成0-BucketCount的整数funcHashCode(keystring)int{varsum =0fori :=0; i

往HashMap里添加键值对在这里顺便给大家推荐一个架构交流群：617434785，里面会分享一些资深架构师录制的视频录像：有Spring，MyBatis，Netty源码分析，高并发、高性能、分布式、微服务架构的原理，JVM性能优化这些成为架构师必备的知识体系。还能领取免费的学习资源。相信对于已经工作和遇到技术瓶颈的码友，在这个群里会有你需要的内容。

//添加键值对func(myMap *HashMap)AddKeyValue(keystring, valuestring){//1.将key散列成0-BucketCount的整数作为Map的数组下标varmapIndex = HashCode(key)//2.获取对应数组头结点varlink = myMap.Buckets[mapIndex]//3.在此链表添加结点iflink.Data.Key ==""&& link.NextNode ==nil{//如果当前链表只有一个节点，说明之前未有值插入修改第一个节点的值即未发生哈希碰撞link.Data.Key = key link.Data.Value = value fmt.Printf("node key:%v add to buckets %d first node\n", key, mapIndex) }else{//发生哈希碰撞index := link.AddNode(KV{key, value}) fmt.Printf("node key:%v add to buckets %d %dth node\n", key, mapIndex, index) }}

根据键从HashMap里取出对应的值

//按键取值func(myMap *HashMap)GetValueForKey(keystring)string{//1.将key散列成0-BucketCount的整数作为Map的数组下标varmapIndex = HashCode(key)//2.获取对应数组头结点varlink = myMap.Buckets[mapIndex]varvaluestring//遍历找到key对应的节点head := linkfor{ifhead.Data.Key == key { value = head.Data.Valuebreak}else{ head = head.NextNode } }returnvalue}

Main_test

packagemainimport("chaors.com/LearnGo/BlockchainCryptography/HashMap")funcmain(){ myMap := HashMap.CreateHashMap() myMap.AddKeyValue("001","1") myMap.AddKeyValue("002","2") myMap.AddKeyValue("003","3") myMap.AddKeyValue("004","4") myMap.AddKeyValue("005","5") myMap.AddKeyValue("006","6") myMap.AddKeyValue("007","7") myMap.AddKeyValue("008","8") myMap.AddKeyValue("009","9") myMap.AddKeyValue("010","10") myMap.AddKeyValue("011","11") myMap.AddKeyValue("012","12") myMap.AddKeyValue("013","13") myMap.AddKeyValue("012","14") myMap.AddKeyValue("015","15")}

RUN

main_test.png

一个简单的HashMap就实现了，虽然我们的散列算法只是用了一个简单的转换算法，这对我们理解HashMap原理已经足够了。

猜你喜欢