HashMap、LinkedHashMap、HashSet、LinkedHashSet 原理解析及关系梳理

本文以jdk源码为线索学习几种数据类型实现机制。

【HashMap数据机制】

HashMap提供了key、value存储机制。
HashMap是LinkedHashMap的基类，其内部维护一个Node数组用来存储数据：

transient Node<K,V>[] table;

为了解决hash冲突，每个节点存储链表或者红黑树。当链表长度小于阈值8时，使用链表存储；当长度达到阈值8时，将链表转换为红黑树提升读写效率：

if ((e = p.next) == null) {
	p.next = newNode(hash, key, value, null);
	if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
		treeifyBin(tab, hash);
}

A. put

public V put(K key, V value);

put数据时，首先依据key计算hash值，与数组尺寸做与运算，计算存储数据在数组中的位置。
若该位置没有数据（未发生hash冲突），直接依据hash值、key、value构造Node存入该位置：

if ((p = tab[i = (n - 1) & hash]) == null)
	tab[i] = newNode(hash, key, value, null);

当存在冲突时，遍历链表/红黑树查找当前key是否存在。若key已经存在，则替代旧的value：

V oldValue = e.value;
e.value = value;
afterNodeAccess(e);
return oldValue;

否则，将新的数据存入链表/红黑树：
插入链表：

if ((e = p.next) == null) {
	p.next = newNode(hash, key, value, null);

插入红黑树：

e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

在插入数据之后，执行回调方法：

afterNodeInsertion(evict);

当数据数量达到一定阈值时，resize()方法将被执行，对数组进行扩容。

Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;

B. remove

public V remove(Object key);

执行remove方法时，将首先依据要移除key的hash值定位在数组中的位置，
之后依据Node类型是TreeNode或链表对key进行查找。
当匹配上时，将node从链表或tree中移除，并将其value作为remove方法返回值。
在remove之后，调用回调方法:

afterNodeRemoval(node);

【linkedHashMap】

为了解决hashMap无序的问题，引入了有序存储key、value的数据结构LinkedHashMap。
linkedHashMap以HashMap为基类，提供了记录插入key、value顺序的功能，读取时将按序输出。

记录的节点以双向链表的形式存储：

transient LinkedHashMap.Entry<K,V> head;
transient LinkedHashMap.Entry<K,V> tail;

A. put

基类HashMap中当插入数据时，构造新节点时执行newNode方法。
LinkedHashMap重写了newNode方法：

Node<K,V> newNode(int hash, K key, V value, Node<K,V> e) {
	LinkedHashMap.Entry<K,V> p =
		new LinkedHashMap.Entry<K,V>(hash, key, value, e);
	linkNodeLast(p);
	return p;
}

每一个put的key、value被构造成双向链表节点p，最终被接在tail节点的后面，成为新的tail节点：

LinkedHashMap.Entry<K,V> last = tail;
tail = p;
p.before = last;
last.after = p;

若put之前存在相同key的旧值，那么就需要将旧值移除。
在插入完成之后，HashMap中会调用afterNodeInsertion方法，LinkedHashMap中实现此模板方法，将双向链表中旧的节点移除。

B. remove

基类HashMap中当remove被调用，将相应key的节点移除后，回调方法afterNodeRemoval将被调用。
LinkedHashMap重写了此方法，将相应key的节点从双向链表中移除。

C. 读取

LinkedHashMap内部的迭代器iterator以双向链表head为起点遍历输出，从而实现有序输出的属性。

【HashSet】

HashSet实现了Set接口，存储一组不重复的元素。
为了实现不重复的功能，其内部使用HashMap存储数据，利用其key的唯一性：

public HashSet() {
	map = new HashMap<>();
}

执行add元素时，

public boolean add(E e) {
	return map.put(e, PRESENT)==null;
}

执行remove移除元素时，

public boolean remove(Object o) {
	return map.remove(o)==PRESENT;
}

遍历元素时，直接使用HashMap的KeySet():

public Iterator<E> iterator() {
	return map.keySet().iterator();
}

由于HashMap内部数据依据hash值在数组中存储，因此HashSet的iterator也是无序的。

【LinkedHashSet】

为了解决HashSet无序存储的问题，引入了LinkedHashSet。

其内部利用了LinkedHashMap有序的特性：

HashSet(int initialCapacity, float loadFactor, boolean dummy) {
	map = new LinkedHashMap<>(initialCapacity, loadFactor);
}

其迭代器返回LinkedHashMap的KeySet，从而实现有序输出。

HashMap、LinkedHashMap、HashSet、LinkedHashSet 原理解析及关系梳理

猜你喜欢