HashMapの過去と現在
Java7に基づいてJava8は、いくつかの改善と最適化を行いました。
そして、基礎となるデータ構造の実装方法であって、書き換えほぼHashMapの
すべてのセットは、例えばforEachのため、機能的な方法を追加しているが、また、有用な多くの機能を追加しました。
過去--Java 1.7
基礎となるデータ構造
配列リスト+
HashMapのJava1.7のにアレイ+鎖ストレージ構造として
衝突が発生したときに、バケットと同様の容器からなるアレイ、リンクリストは、位置データを見つけるために、競合を解決するために使用される現在のバケット(配列添字)に格納されるべきです現在のバケット内のノードの新しいリストを挿入します。
下図のように:
キーのノードリスト(キー、値)に格納されています
拡張と初期化
初期化:最初に、HashMapの配列サイズ(バレル数)デフォルト値は16であり、そして配列サイズでなければならない2のべき乗
図源ノートに示すような外観
メソッドの拡張のサイズを変更
する場合、拡張?
バケットノードリスト要素は超え可変膨張係数= 16×0.75 = 12 threshole膨張を開始するとき
の最大膨張のように定義される整数のサイズ
拡張は倍増しました:
どのように展開:開放新しい配列(バレル)、新しい配列にコピー転送古いデータ配列を用いた方法は、計算されたハッシュ値は、いくつかの要素を上書き(焼き直し)
伝達関数、古いテーブルのバレルは新しいバレルに移動し
、新しいテーブルのインデックスを取得indexFor、再焼き直し、バケットあたりのリンクリストを横断する、新しいテーブルを置きます
ハッシュアルゴリズム
- 配列のサイズでなければなりませんなぜ2のパワー、そして、
我々は見つけるキーの配列インデックスのハッシュ値 2のパワーに設定されている配列の検出方法を、ビット操作にモジュロターンは、単に配列の添字を取得するときのために
栗の場合:例えば、2の長さの5乗、32の、すなわち長さの配列は、我々は、配列の長さ内で得られるハッシュ値(32)とキーとAND演算のための配列の長さを取ると仮定下付き文字、下付き文字は、テーブル内の現在のキー位置がテーブル内にあるべきです。
数字がそれを示しています参照してください。
2のパワーが理由であるしたがって、配列のサイズを定義する必要があり、配列の添字に将来ハッシュアルゴリズム鍵インデックスを計算します。
キーハッシュコードアルゴリズムは1.7で、より複雑で取得し、述べて過大ではありません。
putメソッド
- 比較は、この方法は、キーを使用する必要が等しいので、カスタムクラスメソッドのオーバーライドの必要性が等しいです
- そこで我々は、Stringクラスのメソッドは、キーのキーとして書き直されたと等しいことをお勧めします。
残りの問題:セキュリティ、デッドロック
1. hashmap1.7スレッドセーフな
拡張がデッドロックを起こしやすいリスト、ピット、死者循環リストをコピーするには、データ転送機能を使用する必要がある同時並行、
2. ハッシュ衝突安全性の問題
DOSは、悪質なリクエストに起因すると思わJava1.7ハッシュアルゴリズムの衝突
同じハッシュ値を以下の
解決策:別のハッシュ計算方法を入れて
今生——Java 1.8
基礎となるデータ構造
- HashMapの基礎となるデータ構造は以下の通りである:配列リスト+ +赤黒木。
- 鎖長が8以上である場合、リストはブラックツリーに変換されます。
- 赤黒木のサイズが6に等しい未満である場合、鎖は赤黒木に変換される。
次のように全体のデータ構造です。
拡張と初期化
共通の属性:
//初始容量为 16
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
//最大容量
static final int MAXIMUM_CAPACITY = 1 << 30;
//负载因子默认值
static final float DEFAULT_LOAD_FACTOR = 0.75f;
//桶上的链表长度大于等于8时,链表转化成红黑树
static final int TREEIFY_THRESHOLD = 8;
//桶上的红黑树大小小于等于6时,红黑树转化成链表
static final int UNTREEIFY_THRESHOLD = 6;
//当数组容量大于 64 时,链表才会转化成红黑树
static final int MIN_TREEIFY_CAPACITY = 64;
//记录迭代过程中 HashMap 结构是否发生变化,如果有变化,迭代时会 fail-fast
transient int modCount;
//HashMap 的实际大小,可能不准(因为当你拿到这个值的时候,可能又发生了变化)
transient int size;
//存放数据的数组
transient Node<K,V>[] table;
// 扩容的门槛,有两种情况
// 如果初始化时,给定数组大小的话,通过 tableSizeFor 方法计算,数组大小永远接近于 2 的幂次方,比如你给定初始化大小 19,实际上初始化大小为 32,为 2 的 5 次方。
// 如果是通过 resize 方法进行扩容,大小 = 数组容量 * 0.75
int threshold;
//链表的节点
static class Node<K,V> implements Map.Entry<K,V> {
//红黑树的节点
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V>
- 図16は、初期容量、2の30乗の最大容量として見ることができます
- アレイ容量が64より大きい場合、ノード> 8のリストと、リストは=ブラックツリーに変換される
赤黒木確率に変換する非常に小さい(千分の一)、適切なハッシュため多重衝突の計算はめったに発生しないしないでください
> = 8この値は、我々はポアソン分布、様々な長さのヒットリストの確率が締結ポアソン確率分布関数、参照ノードのリストを考慮し、設計に:
* 0: 0.60653066
* 1: 0.30326533
* 2: 0.07581633
* 3: 0.01263606
* 4: 0.00157952
* 5: 0.00015795
* 6: 0.00001316
* 7: 0.00000094
* 8: 0.00000006
8のリストの時間の長さであるとき、平均、確率は通常の状況下であること、リストの長さが8に到達することはできませんので、千万未満1 0.00000006であり、それは8、確かにハッシュアルゴリズムに達するときこの場合には、HashMapを使用し、HashMapのは、高いクエリパフォーマンスのまま、そのリストは、赤、黒の木に変換させ、我々は通常、コードを書くことを可能にするために、ほとんどヒットリストは、赤と黒に変換されることはありません質問のうち、よう木の場合。
- 拡張
拡張の2つのケースがあります。
初期化は、tableSizeFor法により算出した配列の大きさ、に与えられた場合には、アレイの容量の大きさが似ていますが、配列のサイズは常に2のべき乗である場合、例えば、あなたが19の特定のサイズを初期化し、実際には、初期サイズは32である。つまり、 2の5乗。
膨張をリサイズ方法によって行われる場合は、ときにアレイ容量のサイズ変更のために> 0.75のサイズ*
- 表の原本の拡大した後、java1.7の伝達関数と同様に、複製スレッドを維持するためにjava1.8はまだ安全ではありません
拡張のリストは理解していない時にハイとロー。
低効率、コピーする必要のサイズを変更しますので、頻繁に膨張によるパフォーマンスの問題を回避するために、初期化時に一定の容量を指定するのがベストです。
挿入方法を置きます
- 手順を以下のHashMapの新しいノード:
- 次のようにコードの一部である置きます
// 入参 hash:通过 hash 算法计算出来的值。
// 入参 onlyIfAbsent:false 表示即使 key 已经存在了,仍然会用新值覆盖原来的值,默认为 false
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
// n 表示数组的长度,i 为数组索引下标,p 为 i 下标位置的 Node 值
Node<K,V>[] tab; Node<K,V> p; int n, i;
//如果数组为空,使用 resize 方法初始化
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
// 如果当前索引位置是空的,直接生成新的节点在当前索引位置上
if ((p = tab[i = (n - 1) & hash]) == null)
tab[i] = newNode(hash, key, value, null);
// 如果当前索引位置有值的处理方法,即我们常说的如何解决 hash 冲突
else {
// e 当前节点的临时变量
Node<K,V> e; K k;
// 如果 key 的 hash 和值都相等,直接把当前下标位置的 Node 值赋值给临时变量
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// 如果是红黑树,使用红黑树的方式新增
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
// 是个链表,把新节点放到链表的尾端
else {
// 自旋
for (int binCount = 0; ; ++binCount) {
// e = p.next 表示从头开始,遍历链表
// p.next == null 表明 p 是链表的尾节点
if ((e = p.next) == null) {
// 把新节点放到链表的尾部
p.next = newNode(hash, key, value, null);
// 当链表的长度大于等于 8 时,链表转红黑树
if (binCount >= TREEIFY_THRESHOLD - 1)
treeifyBin(tab, hash);//树化
break;
}
// 链表遍历过程中,发现有元素和新增的元素相等,结束循环
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
//更改循环的当前元素,使 p 在遍历过程中,一直往后移动。
p = e;
}
}
// 说明新节点的新增位置已经找到了
if (e != null) {
V oldValue = e.value;
// 当 onlyIfAbsent 为 false 时,才会覆盖值
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
// 返回老值
return oldValue;
}
}
// 记录 HashMap 的数据结构发生了变化
++modCount;
//如果 HashMap 的实际大小大于扩容的门槛,开始扩容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
キーの配列が、値をカバーしたくない、あなたは組み込み変数onlylfAbsent、ビルトインが真である、それは我々は通常、内蔵onlylfAbsentを使用する方法を入れて、カバーしています持っているputlfAbsent方法を選択することができますがfalseの場合、カバレッジを可能にすることです。
- 新しいノードリスト:ライン上のリストの末尾に新しいノードを追加します。
- 赤黒木のノードに以下の工程を追加
//入参 h:key 的hash值
final TreeNode<K,V> putTreeVal(HashMap<K,V> map, Node<K,V>[] tab,
int h, K k, V v) {
Class<?> kc = null;
boolean searched = false;
//找到根节点
TreeNode<K,V> root = (parent != null) ? root() : this;
//自旋
for (TreeNode<K,V> p = root;;) {
int dir, ph; K pk;
// p hash 值大于 h,说明 p 在 h 的右边
if ((ph = p.hash) > h)
dir = -1;
// p hash 值小于 h,说明 p 在 h 的左边
else if (ph < h)
dir = 1;
//要放进去key在当前树中已经存在了(equals来判断)
else if ((pk = p.key) == k || (k != null && k.equals(pk)))
return p;
//自己实现的Comparable的话,不能用hashcode比较了,需要用compareTo
else if ((kc == null &&
//得到key的Class类型,如果key没有实现Comparable就是null
(kc = comparableClassFor(k)) == null) ||
//当前节点pk和入参k不等
(dir = compareComparables(kc, k, pk)) == 0) {
if (!searched) {
TreeNode<K,V> q, ch;
searched = true;
if (((ch = p.left) != null &&
(q = ch.find(h, k, kc)) != null) ||
((ch = p.right) != null &&
(q = ch.find(h, k, kc)) != null))
return q;
}
dir = tieBreakOrder(k, pk);
}
TreeNode<K,V> xp = p;
//找到和当前hashcode值相近的节点(当前节点的左右子节点其中一个为空即可)
if ((p = (dir <= 0) ? p.left : p.right) == null) {
Node<K,V> xpn = xp.next;
//生成新的节点
TreeNode<K,V> x = map.newTreeNode(h, k, v, xpn);
//把新节点放在当前子节点为空的位置上
if (dir <= 0)
xp.left = x;
else
xp.right = x;
//当前节点和新节点建立父子,前后关系
xp.next = x;
x.parent = x.prev = xp;
if (xpn != null)
((TreeNode<K,V>)xpn).prev = x;
//balanceInsertion 对红黑树进行着色或旋转,以达到更多的查找效率,着色或旋转的几种场景如下
//着色:新节点总是为红色;如果新节点的父亲是黑色,则不需要重新着色;如果父亲是红色,那么必须通过重新着色或者旋转的方法,再次达到红黑树的5个约束条件
//旋转: 父亲是红色,叔叔是黑色时,进行旋转
//如果当前节点是父亲的右节点,则进行左旋
//如果当前节点是父亲的左节点,则进行右旋
//moveRootToFront 方法是把算出来的root放到根节点上
moveRootToFront(tab, balanceInsertion(root, x));
return null;
}
}
}
- 赤黒木についても(ピットを占める)の知識を追加する必要があります
lookupメソッドを取得します
リストクエリ時間の複雑さは、いくつかのリンクリストデータでは比較的高速トラバーサルリストを使用してO(n)は、赤黒木クエリの複雑さは、O。(ログ(N)であり、リスト場合にのみ、より多くのデータ時間は、赤、黒の木、赤黒木に変換されますが、必要なスペースを考慮し、時間と空間の変換損失を取って、二度リストであるので、我々は、境界値の変換を定義する必要があり、ノードリスト> = 8のみ木の行為。
HashMapのステップを探します:
- (LLIノードは、値が等しい比較する)カスタムクラスがequalsメソッドであるにキーリストを書き換える必要がある検索
// 采用自旋方式从链表中查找 key,e 初始为为链表的头节点
do {
// 如果当前节点 hash 等于 key 的 hash,并且 equals 相等,当前节点就是我们要找的节点
// 当 hash 冲突时,同一个 hash 值上是一个链表的时候,我们是通过 equals 方法来比较 key 是否相等的
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
return e;
// 否则,把当前节点的下一个节点拿出来继续寻找
} while ((e = e.next) != null);
- 赤黒木の検索キーは、カスタムクラスはcompatorメソッド(左または右の子ノードが離れて行くかを決定するために赤黒木)書き換える必要があるあります
合理化するハッシュアルゴリズム
取るために、XORハッシュを使用し、排他的論理和16 16高低
static final int hash(Object key) {
int h;
return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}
key 在数组中的位置公式:tab[(n - 1) & hash]
- H ^(時間>>> 16)、そうすることの利点は、より分散の計算されたハッシュ値、シーンのほとんどを作ることです。
ハッシュ値はキーインデックスは、配列内の現在のインデックス位置を計算するとき、計算された後、アレイはモジュロ長を使用するが、モジュロ演算プロセッサの計算のために、比較的遅いことができるB場合、数式は、あります2の電源は、%B = A・(場合 B-1)は、 ここで算出された位置のインデックスは、我々が交換できるように、(N-1)・ハッシュ 。
ツリーがステータスリンクリストに変質しやすいように、赤黒木は平衡二分木であり、高さはスピンによって調整されます
新しいメソッド
- getOrDefault:対応するキーの値が存在しない場合は、目的の戻り値のデフォルト値はdefaultValue
public V getOrDefault(Object key, V defaultValue) {
Node<K,V> e;
return (e = getNode(hash(key), key)) == null ? defaultValue : e.value;
}
- putlfAbsent(Kキー、V値):キーのマップがある場合は、キーが存在しない場合、その値は対象外となります、新しい成功。
- コンピューティング:キーの値の後に、私たちは値を計算して、マップに配置することができます、キー値が存在しない未知の起因するエラーを防止するために、
- computelfPresent方法:キーがある場合にのみ、それは計算を実行していること
public void compute(){
HashMap<Integer,Integer> map = Maps.newHashMap();
map.put(10,10);
log.info("compute 之前值为:{}",map.get(10));
map.compute(10,(key,value) -> key * value);
log.info("compute 之后值为:{}",map.get(10));
// 还原测试值
map.put(10,10);
// 如果为 11 的 key 不存在的话,需要注意 value 为空的情况,下面这行代码就会报空指针
// map.compute(11,(key,value) -> key * value);
// 为了防止 key 不存在时导致的未知异常,我们一般有两种办法
// 1:自己判断空指针
map.compute(11,(key,value) -> null == value ? null : key * value);
// 2:computeIfPresent 方法里面判断
map.computeIfPresent(11,(key,value) -> key * value);
log.info("computeIfPresent 之后值为:{}",map.get(11));
}
结果是:
compute 之前值为:10
compute 之后值为:100
computeIfPresent 之后值为:null(这个结果中,可以看出,使用 computeIfPresent 避免了空指针)
過去からの運動、--defaultを提示します
- コレクションのJava8はなぜJava7これらのインタフェースの実装では、これらの方法を強制する必要はありません、多くの方法を追加しましたか?
これらの新しいメソッドは、インターフェイスの変更のデフォルトの方法と、私たちはこれらのメソッドを実装することを余儀なくされることなく、インターフェイスメソッドのデフォルトの実装、およびサブクラスに記述する必要がある、defaultキーワードを変更していないので、これらのインタフェースのJava7を実装する必要が主な理由認知。
概要:サンセイIIIのHashMapの
Java7に基づいてJava8は、デフォルトのキーワードで世代を接続するには、いくつかの改善と最適化を行いました。HashMapのほとんどすべてのコレクションのセットを書き換えるには、forEachのような機能的なアプローチを、追加するだけでなく、便利な機能をたくさん追加されています。