简介
Hashtable和HashM类似,同样是基于哈希表实现的,同样每个元素是一个key-value对,但其内部只是通过单链表解决哈希冲突问题,而没有红黑树结构,当HashTable容量不足(超过了阀值)时,同样会进行扩容操作。Hashtable类声明如下:
public class Hashtable<K,V> extends Dictionary<K,V> implements Map<K,V>, Cloneable, java.io.Serializable
它继承于Dictionary,实现了Map、Cloneable、 Serializable等接口。
Hashtable实现了Map接口,可以对它进行哈希表操作;实现了Cloneable接口,能被克隆;实现了Serializable接口,因此它支持序列化,能够通过序列化传输。
Hashtable是JDK1.0引入的类,Hashtable的很多方法都用synchronized修饰,是线程安全的,可以用于多线程环境中。
Hashtable源码详解
HashTable有如下几个成员变量:
// 存储链表的数组 private transient Entry<?,?>[] table; // 键值对的个数 private transient int count; // 下一次resize的阈值大小 = HashTable容量 * 负载因子 private int threshold; // 负载因子 private float loadFactor; // HashTable结构修改次数,用于fail-fast机制 private transient int modCount = 0;
HashTable中的节点都被封装成为了Entry类型数据:
private static class Entry<K,V> implements Map.Entry<K,V> { // 哈希值 final int hash; final K key; V value; // 指向链表中的下一节点 Entry<K,V> next; // 构造方法 protected Entry(int hash, K key, V value, Entry<K,V> next) { this.hash = hash; this.key = key; this.value = value; this.next = next; } @SuppressWarnings("unchecked") protected Object clone() { return new Entry<>(hash, key, value, (next==null ? null : (Entry<K,V>) next.clone())); } // Map.Entry Ops public K getKey() { return key; } public V getValue() { return value; } // 设置value,若value是null,则抛出NullPointerException异常 public V setValue(V value) { if (value == null) throw new NullPointerException(); V oldValue = this.value; this.value = value; return oldValue; } public boolean equals(Object o) { if (!(o instanceof Map.Entry)) return false; Map.Entry<?,?> e = (Map.Entry<?,?>)o; return (key==null ? e.getKey()==null : key.equals(e.getKey())) && (value==null ? e.getValue()==null : value.equals(e.getValue())); } public int hashCode() { return hash ^ Objects.hashCode(value); } public String toString() { return key.toString()+"="+value.toString(); } }
HashTable有如下四个构造方法:
// 参数指定了HashTable初始化时的容量以及负载因子 public Hashtable(int initialCapacity, float loadFactor) { if (initialCapacity < 0) throw new IllegalArgumentException("Illegal Capacity: "+ initialCapacity); if (loadFactor <= 0 || Float.isNaN(loadFactor)) throw new IllegalArgumentException("Illegal Load: "+loadFactor); if (initialCapacity==0) initialCapacity = 1; this.loadFactor = loadFactor; table = new Entry<?,?>[initialCapacity]; threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1); } // 参数指定了HashMap初始化时的容量,负载因子默认为0.75 public Hashtable(int initialCapacity) { this(initialCapacity, 0.75f); } // 无参构造方法,默认的初始化容量为11,负载因子默认为的0.75 public Hashtable() { this(11, 0.75f); } // 根据其他Map来创建HashTable,负载因子为0.75 public Hashtable(Map<? extends K, ? extends V> t) { this(Math.max(2*t.size(), 11), 0.75f); putAll(t); }
我们下面来看HashTable的几个关键方法:put方法、get方法和remove方法。
put(K key, V value)方法
public synchronized V put(K key, V value) { // 若插入元素的value为null则抛出NullPointerException异常 if (value == null) { throw new NullPointerException(); } // Makes sure the key is not already in the hashtable. Entry<?,?> tab[] = table; // 计算key的hashcode int hash = key.hashCode(); // 计算key在table数组中的下标 int index = (hash & 0x7FFFFFFF) % tab.length; @SuppressWarnings("unchecked") Entry<K,V> entry = (Entry<K,V>)tab[index]; // 若数组对应下标不为null,则表明发生了哈希冲突 for(; entry != null ; entry = entry.next) { // 若链表中已经存在键值为key的节点,则将key对应的value替换 if ((entry.hash == hash) && entry.key.equals(key)) { V old = entry.value; entry.value = value; // 返回旧的value return old; } } // 将元素添加到对应下标的链表中 addEntry(hash, key, value, index); return null; }
从上面的源码中我们可以看出,HashTable的key和value都不可以为null,若value为null,则程序会直接抛出NullPointerException异常,若key为null,则在计算key的hashcode时,也会抛出NullPointerException异常。
若链表中没有找到键值为key的节点,则通过addEntry方法将键值对添加到HashTable中:
private void addEntry(int hash, K key, V value, int index) { // HashTable的结构修改次数加1 modCount++; Entry<?,?> tab[] = table; // 若节点个数 >= 阈值,则通过rehash()方法进行扩容操作 if (count >= threshold) { // Rehash the table if the threshold is exceeded rehash(); tab = table; hash = key.hashCode(); // 扩容之后,计算节点对应的新下标 index = (hash & 0x7FFFFFFF) % tab.length; } // Creates the new entry. @SuppressWarnings("unchecked") Entry<K,V> e = (Entry<K,V>) tab[index]; // 将节点插入到链表的表头 tab[index] = new Entry<>(hash, key, value, e); // 节点数目加1 count++; }
若节点个数 >= 阈值,则通过rehash()方法进行扩容操作,我们来看一看rehash()方法:
protected void rehash() { int oldCapacity = table.length; Entry<?,?>[] oldMap = table; // 计算新的容量newCapacity = (oldCapacity << 1) + 1,即新容量 = 旧容量 * 2 + 1 int newCapacity = (oldCapacity << 1) + 1; // 若新容量大于MAX_ARRAY_SIZE,MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8 if (newCapacity - MAX_ARRAY_SIZE > 0) { // 若旧容量等于MAX_ARRAY_SIZE,则直接返回 if (oldCapacity == MAX_ARRAY_SIZE) // Keep running with MAX_ARRAY_SIZE buckets return; // 将新容量设置为MAX_ARRAY_SIZE newCapacity = MAX_ARRAY_SIZE; } // 创建新的Entry数组 Entry<?,?>[] newMap = new Entry<?,?>[newCapacity]; modCount++; // 计算threshold threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1); table = newMap; // 将旧数组的节点复制到新Entry数组中,i为数组下标 for (int i = oldCapacity ; i-- > 0 ;) { // old为数组下标对应的链表节点 for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) { Entry<K,V> e = old; old = old.next; // 重新计算节点的下标 int index = (e.hash & 0x7FFFFFFF) % newCapacity; // 将节点插入到新数组中 e.next = (Entry<K,V>)newMap[index]; newMap[index] = e; } } }
get(Object key)方法
public synchronized V get(Object key) { Entry<?,?> tab[] = table; // 计算key的hashcode int hash = key.hashCode(); // 计算key对应的数组下标 int index = (hash & 0x7FFFFFFF) % tab.length; // 遍历数组下表对应的链表 for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) { // 找到匹配的节点,直接返回 if ((e.hash == hash) && e.key.equals(key)) { return (V)e.value; } } // 返回null return null; }
remove(Object key)方法
public synchronized V remove(Object key) { Entry<?,?> tab[] = table; // 计算key的hashcode int hash = key.hashCode(); // 计算key对应的数组下标 int index = (hash & 0x7FFFFFFF) % tab.length; @SuppressWarnings("unchecked") Entry<K,V> e = (Entry<K,V>)tab[index]; // 遍历数组下表对应的链表,找到对应节点并删除 // 因为是单链表,因此要保留待删节点的前一个节点,才能有效地删除节点 for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) { if ((e.hash == hash) && e.key.equals(key)) { modCount++; if (prev != null) { prev.next = e.next; } else { tab[index] = e.next; } count--; V oldValue = e.value; e.value = null; return oldValue; } } return null; }
HashTable其他相关方法
因为HashTable的key和value都不可以为null,所以,判断一个key在HashTable中是否存在,可以用get(Object)方法的返回值是否为null来判断,同时,也可以用containsKey(Object)方法来判断,该方法与get(Object)方法很相似:
public synchronized boolean containsKey(Object key) { Entry<?,?> tab[] = table; // 计算key的hashcode int hash = key.hashCode(); // 计算key对应的数组下标 int index = (hash & 0x7FFFFFFF) % tab.length; // 遍历数组下表对应的链表 for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) { // 找到匹配的节点,返回true if ((e.hash == hash) && e.key.equals(key)) { return true; } } // 返回false return false; }
clear()方法
// 删除HashTable中所有的键值对 public synchronized void clear() { Entry<?,?> tab[] = table; modCount++; for (int index = tab.length; --index >= 0; ) // tab[index] = null,表明JVM可以对节点的内存进行回收,同时tab也不再拥有其内存空间 tab[index] = null; count = 0; }
HashTable中的modCount的作用这里不再解释,可以参考这篇博客。
HashTable与HashMap的主要异同点
- 它们都是通过哈希表来实现的,而且都是通过链表来解决哈希冲突的,但是HashMap在链表达到一定长度之后,会将其转化为红黑树。
- 它们计算节点哈希值的方式不同,若key的hashcode为h,则HashMap通过h ^ (h >>> 16)来计算节点的哈希值,而HashTable则将h作为节点的哈希值。
- 它们计算节点对应数组索引下标的方式也不同,HashMap通过haseCode & (capacity - 1)是用来计算节点对应的数组下标,HashTable通过(hashCode & 0x7FFFFFFF) % capacity来计算节点对应的数组下标。hashCode & 0x7FFFFFFF的目的是为了将负的hash值转化为正值。
- HashTable的默认容量为11,而HashMap默认容量为16,Hashtable不要求底层数组的容量一定要为2的整数次幂,而HashMap则要求一定为2的整数次幂。但是,它们的默认负载因子都是0.75。
- Hashtable扩容时,会将容量变为原来的2倍加1,而HashMap扩容时,会将容量变为原来的2倍。
- Hashtable中key和value都不允许为null,而HashMap中key和value都允许为null(key只能有一个为null,而value则可以有多个为null)。若Hashtable中的key或者value为null,则程序运行时会抛出NullPointerException异常。
- HashTable中的大部分的方法都被synchronized修饰,所以HashTable是线程安全的,可以用于多线程环境中,而HashMap则不行。