ハッシュマップのput()メソッドの分析

最近のインタビュー中に、インタビュアーはハッシュマップのput()メソッドが何をしたかを尋ねました。私は答えが十分ではないと思います。ここでハッシュマップを研究して要約します。HashMapは主にキーと値のペアを格納するために使用されます。
ギリシャのテーブルのMapインターフェース実装は、一般的に使用されるJavaコレクションの1つです。

JDK1.8より前は、HashMapは配列+リンクリストで構成されていました。配列はHashMapの本体であり、リンクリストは主にハッシュの競合を解決するために存在します(競合を解決するための「zipperメソッド」)。大幅な変更により、リンクリストの長さがしきい値(デフォルトは8)より大きい場合、リンクリストは赤と黒のツリーに変換され、検索時間が短縮されます。
ここに画像の説明を挿入あまり意味がありません。hashMapのput()メソッドを見てください。

public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }

最初にhash()メソッドを見てください。

      static final int hash(Object key) {
        int h;
        // key.hashCode():返回散列值也就是hashcode
        // ^ :按位异或
        // >>>:无符号右移,忽略符号位,空位都以0补齐
        return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
    }

とにかく、int型のハッシュ値を取得する一連のアルゴリズムに従って、putVal()メソッドを確認します。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    // table未初始化或者长度为0,进行扩容
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    // (n - 1) & hash 确定元素存放在哪个桶中,桶为空,新生成结点放入桶中(此时,这个结点是放在数组中)
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    // 桶中已经存在元素
    else {
        Node<K,V> e; K k;
        // 比较桶中第一个元素(数组中的结点)的hash值相等,key相等
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
                // 将第一个元素赋值给e,用e来记录
                e = p;
        // hash值不相等,即key不相等;为红黑树结点
        else if (p instanceof TreeNode)
            // 放入树中
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        // 为链表结点
        else {
            // 在链表最末插入结点
            for (int binCount = 0; ; ++binCount) {
                // 到达链表的尾部
                if ((e = p.next) == null) {
                    // 在尾部插入新结点
                    p.next = newNode(hash, key, value, null);
                    // 结点数量达到阈值,转化为红黑树
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    // 跳出循环
                    break;
                }
                // 判断链表中结点的key值与插入的元素的key值是否相等
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    // 相等,跳出循环
                    break;
                // 用于遍历桶中的链表,与前面的e = p.next组合,可以遍历链表
                p = e;
            }
        }
        // 表示在桶中找到key值、hash值与插入元素相等的结点
        if (e != null) { 
            // 记录e的value
            V oldValue = e.value;
            // onlyIfAbsent为false或者旧值为null
            if (!onlyIfAbsent || oldValue == null)
                //用新值替换旧值
                e.value = value;
            // 访问后回调
            afterNodeAccess(e);
            // 返回旧值
            return oldValue;
        }
    }
    // 结构性修改
    ++modCount;
    // 实际大小大于阈值则扩容
    if (++size > threshold)
        resize();
    // 插入后回调
    afterNodeInsertion(evict);
    return null;
} 

Node <K、V> []配列に格納されている添え字が(n-1)とハッシュによって取得されることについて触れておきますが、
JavaのAND演算の利点は何ですか?
演算規則:0&0 = 0; 0 = 0 1; 1&0 = 0; 1&1 = 1
すなわち:2同時に、「1」、結果は以下の「1」、又は二つの例0を組み合わせた:
ここに画像の説明を挿入
先に述べたように、HashMapのメンテナンスの配列を主に使用されていますデータ構造では、配列内の要素の位置ができるだけ均一に分布している場合、この配列内のリンクリストは要素が1つしかない可能性が高いため、データを反復処理する場合に非常に便利なので、次のようにする必要があります。異なるハッシュ値を持つデータを異なる配列位置に配置してみてください。

上記の操作を見ると、すべての容量が1つ減った後のデータが高い場合にのみ、操作後のハッシュの衝突の確率が減ります。そのため、ハッシュマップの配列のサイズは2のべき乗です。
初期ハッシュマップのメソッドと組み合わせると、特定の容量のハッシュマップでは、そのサイズは常に2の累乗になります。

 static final int tableSizeFor(int cap) {
        int n = cap - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
    }

put()メソッドのフローを簡単に要約します。

  1. ハッシュ(オブジェクトキー)を実行してint型のハッシュ値を取得すると、このハッシュ値に従ってノードノードの場所を見つけることができます。

  2. テーブルが空かどうか、またはこれが挿入された最初の要素であることを示すために空であるかどうかを確認し、容量拡張にresize()を使用します。初期サイズはデフォルトで16です。

  3. テーブルが空の場合は、ハッシュの衝突がないことを意味し、ノードノードを直接挿入し、手順5に進みます。それ以外の場合は、次の手順に進みます。

  4. テーブルが空でない場合、次の3つの判断が行われます:
    1.バケットの最初の要素(配列のノード)のハッシュ値が等しく、キーが等しく、値がノードeに割り当てられます
    。2。ハッシュ値が等しくなく、キーを示します等しくない、それは赤黒ツリーであり、ツリーに入れて、値をノードノードeに割り当てます
    .3。リンクされたリストの長さが8より大きい場合、長さの判断も行われます。リンクされたリストは、格納用に赤と黒のツリーに変換する必要があります。

  5. 新しく挿入された値によってサイズがしきい値を超えるかどうかを判断し、容量を拡張します

上記の要約はあまり正確ではない可能性があります。特定の状況は上記のコードのコメントに依存しますが、全体的なプロセスは次のようになります。

公開された39元の記事 ウォンの賞賛1 ビュー4620

おすすめ

転載: blog.csdn.net/thetimelyrain/article/details/99873881