超详细的HashMap底层实现原理解析,建议初学者收藏

水平有限,难免会有疏漏之处,如有错误,还请指出,感谢!

前言

HashMa是Java中最常用的集合类框架,也是Java语言中非常典型的数据结构,同时也是我们需要掌握的数据结构,更重要的是进大厂面试必问之一。在这里插入图片描述

数组特点

  • 存储区间是连续,且占用内存严重,空间复杂也很大,时间复杂为O(1)。

  • 优点:是随机读取效率很高,原因数组是连续(随机访问性强,查找速度快)。

  • 缺点:插入和删除数据效率低,因插入数据,这个位置后面的数据在内存中要往后移的,且大小固定不易动态扩展。

链表特点

  • 区间离散,占用内存宽松,空间复杂度小,时间复杂度O(N)。

  • 优点:插入删除速度快,内存利用率高,没有大小固定,扩展灵活。

  • 缺点:不能随机查找,每次都是从第一个开始遍历(查询效率低)。

哈希表特点

以上数组和链表,大家都知道各自优缺点。那么我们能不能把以上两种结合一起使用,从而实现查询效率高和插入删除效率也高的数据结构呢?答案是可以滴,那就是哈希表可以满足,接下来我们一起复习HashMap中的put()和get()方法实现原理。在这里插入图片描述

HashMap的put()和get()的实现

1、map.put(k,v)实现原理

第一步:首先将k,v封装到Node对象当中(节点)

第二步:通过哈希算法计算出当前key的hash值

第三步:再通过哈希表函数/哈希算法,将hash值转换成数组的下标,下标位置上如果没有任何元素,就把Node添加到这个位置上。

如果说下标对应的位置上有链表。此时,就会拿着k和链表上每个节点的k进行equal。

如果所有的equals方法返回都是false,那么这个新的节点将被添加到链表的末

尾。如其中有一个equals返回了true,那么这个节点的value将会被覆盖。

// 存储时:
// 这个hashCode方法这里不详述,只要理解每个key的hash是一个固定的int值即可
int hash = key.hashCode(); 
int index = hash % Entry[].length;
Entry[index] = value;

2、map.get(k)实现原理

//数组长度减1与运算hash值
first = tab[(n - 1) & hash]

第一步:先调用k的hashCode()方法得出哈希值,并通过哈希算法转换成数组的下标。

第二步:通过上一步哈希算法转换成数组的下标之后,在通过数组下标快速定位到某个位置上。

重点理解

如果这个位置上什么都没有,则返回null。

如果这个位置上有单向链表,那么它就会拿着参数K和单向链表上的每一个节点的K进行equals,如果所有equals方法都返回false,则get方法返回null。

如果其中一个节点的K和参数K进行equals返回true,那么此时该节点的value就是我们要找的value了,get方法最终返回这个要找的value。

3、为何随机增删、查询效率都很高的原因是?

原因:增删是在链表上完成的,而查询只需扫描部分,则效率高。

HashMap集合的key,会先后调用两个方法,hashCode and equals方法,这两个方法都需要重写。

4、为什么放在hashMap集合key部分的元素需要重写equals方法?

因为equals默认比较是两个对象内存地址

5、HashMap总结

  • 无序,不可重复

为什么是无序的?

  • 因为不一定挂到哪一个单向链表上的,因此加入顺序和取出也不一样。

怎么保持不可重复?

  • 使用equals方法来保证HashMap集合key不可重复,如key重复来,value就会覆盖。存放在HashMap集合key部分的元素,其实就是存放在HashSet集合中,则HashSet集合也需要重写equals和hashCode方法。

  • hashmap集合的默认初始化容量为16,默认加载因子为0.75,也就是说这个默认加载因子是当hashMap集合底层数组的容量达到75%时,数组就开始扩容。

  • hashmap集合初始化容量是2的陪数,为了达到散列均匀,提高hashmap集合的存取效率,

6、注意JDK8之后

JDK8之后,如果哈希表单向链表中元素超过8个,那么单向链表这种数据结构会变成红黑树数据结构。当红黑树上的节点数量小于6个,会重新把红黑树变成单向链表数据结构,官方源码如下图。在这里插入图片描述

问题:

如果O1和O2的hash值相同,就会存放到同一个单向链表上,

如果不同,但由于哈希算法执行结束之后转换的数组下标可能相同,此时会发上“哈希碰撞”。

HashMap的存取是采用什么算法实现?

// 存储时:
// 这个hashCode方法这里不详述,只要理解每个key的hash是一个固定的int值即可
int hash = key.hashCode(); 
int index = hash % Entry[].length;
Entry[index] = value;

// 取值时:
int hash = key.hashCode();
int index = hash % Entry[].length;
return Entry[index];

7、高频面试题

  • HashMap的工作原理是什么?

  • HashMap中的“死锁”是怎么回事?

  • HashMap中能put两个相同key吗?为什么?

  • HashMap中的键值可以为空吗?原理?

  • HashMap扩容机制?

另,如果觉得这本篇文章写得不错,有点东西的话,记得来个三连【点赞+关注+分享】。

需要大数据、Java、redis、Dubbo框架等教程,关注微信公众号:自学大数据踩的抗 【回复相关术语】

猜你喜欢

转载自blog.csdn.net/realize_dream/article/details/105907328