Java8 Hashtable 源码阅读
一、Hashtable 概述
Hashtable
底层基于数组与链表实现,通过 synchronized
关键字保证在多线程的环境下仍然可以正常使用。虽然在多线程环境下有了更好的替代者 ConcurrentHashMap
,但是作为一个面试中高频的知识点,我们还是有必要了解一下其内部实现细节的。
1.1 内部属性
// 内部数组
private transient Entry<?,?>[] table;
// 键值对数量
private transient int count;
// 扩容阈值
private int threshold;
// 加载因子
private float loadFactor;
内部属性与 HashMap
几乎一致,HashMap
中的 threshold
属性并不止是扩容阈值,还有另一个作用:哈希表容量大小,这一点要注意区分。
1.2 相关构造函数
public Hashtable(int initialCapacity, float loadFactor) {
if (initialCapacity < 0)
throw new IllegalArgumentException("Illegal Capacity: "+
initialCapacity);
if (loadFactor <= 0 || Float.isNaN(loadFactor))
throw new IllegalArgumentException("Illegal Load: "+loadFactor);
if (initialCapacity==0)
initialCapacity = 1;
this.loadFactor = loadFactor;
// 初始化哈希表数组大小,HashMap 中初始化容量大小必须是 2 的幂,但是 Hashtable 没有这个限制
table = new Entry<?,?>[initialCapacity];
// 初始化扩容阈值
threshold = (int)Math.min(initialCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
}
默认初始化大小与加载因子的构造函数,HashMap
的默认初始化大小是 16,而 Hashtable
是 11,加载因子默认都是 0.75.
public Hashtable() {
this(11, 0.75f);
}
1.3 Entry
private static class Entry<K,V> implements Map.Entry<K,V> {
final int hash;
final K key;
V value;
Entry<K,V> next;
protected Entry(int hash, K key, V value, Entry<K,V> next) {
this.hash = hash;
this.key = key;
this.value = value;
this.next = next;
}
......
}
没有什么好说的,唯一注意区分的是,在 HashMap
中对应的是 Node
结构。
二、源码分析
2.1 put 方法
public synchronized V put(K key, V value) {
// Make sure the value is not null
// key(如果为 null,计算哈希值时会抛异常),value 不允许为 null
if (value == null) {
throw new NullPointerException();
}
// Makes sure the key is not already in the hashtable.
Entry<?,?> tab[] = table;
int hash = key.hashCode();
// 计算对应的桶位置
int index = (hash & 0x7FFFFFFF) % tab.length;
@SuppressWarnings("unchecked")
Entry<K,V> entry = (Entry<K,V>)tab[index];
// 如果桶位置上对应的链表不为 null,则遍历该链表
for(; entry != null ; entry = entry.next) {
// key 重复,value 替换,返回老的 value
if ((entry.hash == hash) && entry.key.equals(key)) {
V old = entry.value;
entry.value = value;
return old;
}
}
// 添加新的键值对
addEntry(hash, key, value, index);
// 添加成功返回 null
return null;
}
put
方法中并没有直接添加键值对,而是通过 addEntry
方法来完成添加的过程。
private void addEntry(int hash, K key, V value, int index) {
modCount++;
Entry<?,?> tab[] = table;
// 延迟 rehash?先判断是否需要扩容再 count++
if (count >= threshold) {
// Rehash the table if the threshold is exceeded
rehash();
tab = table;
hash = key.hashCode();
// 扩容后,新的键值对对应的桶位置可能会发生变化,因此要重新计算桶位置
index = (hash & 0x7FFFFFFF) % tab.length;
}
// Creates the new entry.
@SuppressWarnings("unchecked")
// 获取桶位置上的链表
Entry<K,V> e = (Entry<K,V>) tab[index];
// 头插法插入键值对
tab[index] = new Entry<>(hash, key, value, e);
// count++
count++;
}
添加的键值对的方法还是比较简单的,先根据哈希值计算出在哈希表数组中对应的桶位置,遍历当前桶位置上的链表(如果存在),判断 key 是否重复,如果重复用新的 value 覆盖旧的 value,返回 旧的 value。如果 key 不重复,则调用添加键值对的方法(addEntry
),addEntry
首先判断了是否需要扩容,如果需要扩容则先进行哈希表的扩容,并重新计算添加的键值对的桶位置,如果不需要扩容,则直接在头节点插入新的键值对。
⚠️HashMap
先添加键值对,然后判断是否需要扩容,Hashtable
是先判断是否需要扩容然后再添加键值对,这一点需要区分下。
还有一点需要注意的是:java8 中 HashMap
通过尾插法插入新的键值对,Hashtable
通过尾插法插入键值对。
2.2 rehash 方法
上面我们提到了扩容机制,下面我们就来看一下其具体实现。
protected void rehash() {
// 获取老哈希表容量
int oldCapacity = table.length;
Entry<?,?>[] oldMap = table;
// overflow-conscious code
// 新哈希表容量为原容量的 2 倍 + 1,与 HashMap 不同
int newCapacity = (oldCapacity << 1) + 1;
// 容量很大特殊处理
if (newCapacity - MAX_ARRAY_SIZE > 0) {
if (oldCapacity == MAX_ARRAY_SIZE)
// Keep running with MAX_ARRAY_SIZE buckets
return;
newCapacity = MAX_ARRAY_SIZE;
}
// 初始化新哈希表数组
Entry<?,?>[] newMap = new Entry<?,?>[newCapacity];
modCount++;
// 重置扩容阈值,与 HashMap 不同,HashMap 直接把 threshold 也扩大为原来的两倍
threshold = (int)Math.min(newCapacity * loadFactor, MAX_ARRAY_SIZE + 1);
// 重置哈希表数组
table = newMap;
// 从底向上进行 rehash
for (int i = oldCapacity ; i-- > 0 ;) {
// 获取旧哈希表对应桶位置上的链表
for (Entry<K,V> old = (Entry<K,V>)oldMap[i] ; old != null ; ) {
// 链表
Entry<K,V> e = old;
// 重置继续遍历
old = old.next;
// 获取在新哈希表中的桶位置,键值对逐个进行 rehash
// HashMap 会构造一个新的链表然后整个链表进行 rehash
int index = (e.hash & 0x7FFFFFFF) % newCapacity;
// 头插法 rehash
e.next = (Entry<K,V>)newMap[index];
// 自己做头节点
newMap[index] = e;
}
}
}
与 HashMap
相对比,Hashtable
的 rehash 过程也比较简单,首先将容量扩大为原来的 2 倍 + 1,接着重置 threshold
,赋值新的哈希表数组之后就进行键值对 rehash 了。键值对 rehash 的时候从老哈希表数组尾部开始,获取对应桶位置上的链表,键值对逐个进行 rehash。
2.3 get 方法
相对于上面两个方法,get
方法相对来说又简单了很多。
public synchronized V get(Object key) {
Entry<?,?> tab[] = table;
int hash = key.hashCode();
// 计算 key 对应的桶位置
int index = (hash & 0x7FFFFFFF) % tab.length;
// 遍历桶位置上的链表(如果存在)
for (Entry<?,?> e = tab[index] ; e != null ; e = e.next) {
// 找到对应的 key,直接返回对应的 value
if ((e.hash == hash) && e.key.equals(key)) {
return (V)e.value;
}
}
return null;
}
2.4 remove 方法
public synchronized V remove(Object key) {
Entry<?,?> tab[] = table;
int hash = key.hashCode();
// 根据 key 的哈希值计算对应的桶位置
int index = (hash & 0x7FFFFFFF) % tab.length;
@SuppressWarnings("unchecked")
// 获取桶位置上对应的链表
Entry<K,V> e = (Entry<K,V>)tab[index];
for(Entry<K,V> prev = null ; e != null ; prev = e, e = e.next) {
if ((e.hash == hash) && e.key.equals(key)) {
modCount++;
// 移除的非头节点
if (prev != null) {
// 断开要移除的节点 e
prev.next = e.next;
} else {
// 如果要移除的是头节点则重置后面的节点为头节点
tab[index] = e.next;
}
count--;
V oldValue = e.value;
// help GC
e.value = null;
return oldValue;
}
}
return null;
}
根据 key 删除键值对方法也比较简单,根据哈希值计算出对应的桶位置后,找到对应桶位置上的链表,判断删除的是不是头节点,如果是则把后面的节点置为头节点,如果不是,只要改变前节点的后继节点为删除节点的后继节点就可以了。
三、other
在分析源码的时候对比了很多与 HashMap
的不同点,在看 Hashtable
源码的时候建议与 HashMap
对比着看,可以加深对 map 的理解。
Hashtable
的内部实现相对来说比较简单,数据结构通过数组和链表实现。如果你需要在并发编程中使用 map,建议使用 ConcurrentHashMap
,性能相对于 Hashtable
要高很多,后面有机会我们再讨论 ConcurrentHashMap
的内部实现。
jdk1.8 源码阅读:https://github.com/zchen96/jdk1.8-source-code-read
Java8 HashMap 扩容机制与线程安全分析:https://blog.****.net/codejas/article/details/85056606