前言

前面我们讲了HashMap的源码，知道HashMap是线程不安全的。今天我们就来讲一讲在JUC( java.util.concurrent)并发包中线程安全的HashMap-----ConcurrentHashMap
想了解HashMap源码的同学可以去看之前的文章链接: 深入理解HashMap(JDK8)

ConcurrentHashMap源码

注意：我会把源码中每个方法的作用都注释出来，可以参考注释进行理解。

put()

    final V putVal(K key, V value, boolean onlyIfAbsent) {
    
    
    	//concurrentHashMap不允许空值
        if (key == null || value == null) throw new NullPointerException();
        //获取key的hash值
        int hash = spread(key.hashCode());
        int binCount = 0;
        for (Node<K,V>[] tab = table;;) {
    
    
            Node<K,V> f; int n, i, fh;
            //如果数组为空
            if (tab == null || (n = tab.length) == 0)
            	//初始化
                tab = initTable();
            //获取下标，如果该位置为空
            else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
    
    
            	//通过cas插入，保证线程安全
                if (casTabAt(tab, i, null,
                             new Node<K,V>(hash, key, value, null)))
                    break;                   // no lock when adding to empty bin
            }
            //表示当前有线程在进行扩容
            //需要去帮它扩容
            else if ((fh = f.hash) == MOVED)
                tab = helpTransfer(tab, f);
            else {
    
    
            	//当前位置存在hash冲突
                V oldVal = null;
                //加锁表示线程安全
                synchronized (f) {
    
    
                //判断当前值是不是还是以前的值
                //因为多线程，当前值可能被改变了
                    if (tabAt(tab, i) == f) {
    
    
                    	//表示链表
                        if (fh >= 0) {
    
    
                            binCount = 1;
                            for (Node<K,V> e = f;; ++binCount) {
    
    
                                K ek;
                                if (e.hash == hash &&
                                    ((ek = e.key) == key ||
                                     (ek != null && key.equals(ek)))) {
    
    
                                    oldVal = e.val;
                                    if (!onlyIfAbsent)
                                        e.val = value;
                                    break;
                                }
                                Node<K,V> pred = e;
                                if ((e = e.next) == null) {
    
    
                                    pred.next = new Node<K,V>(hash, key,
                                                              value, null);
                                    break;
                                }
                            }
                        }
                        //红黑树
                        else if (f instanceof TreeBin) {
    
    
                            Node<K,V> p;
                            binCount = 2;
                            if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
                                                           value)) != null) {
    
    
                                oldVal = p.val;
                                if (!onlyIfAbsent)
                                    p.val = value;
                            }
                        }
                    }
                }
                if (binCount != 0) {
    
    
                    if (binCount >= TREEIFY_THRESHOLD)
                        treeifyBin(tab, i);
                    if (oldVal != null)
                        return oldVal;
                    break;
                }
            }
        }
        //增加次数
        addCount(1L, binCount);
        return null;
    }

第一步，就是去判断kye，value的值，因为ConcurrentHashMap不允许有null值
第二步，当数组为空的时候，initTable初始化数组

initTable()初始化数组

private final Node<K,V>[] initTable() {
    
    
        Node<K,V>[] tab; int sc;
        while ((tab = table) == null || tab.length == 0) {
    
    
        	//sizeCtl《0 表示初始化的工作已经被其他线程抢去了
            if ((sc = sizeCtl) < 0)
                Thread.yield(); // lost initialization race; just spin
                //否则，通过cas操作将SIZECTL变为-1，表示抢占了
            else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
    
    
                try {
    
    
                    if ((tab = table) == null || tab.length == 0) {
    
    
                        int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
                        @SuppressWarnings("unchecked")
                        Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
                        table = tab = nt;
                        sc = n - (n >>> 2);//12
                    }
                } finally {
    
    
                	//最后将阈值赋值
                    sizeCtl = sc;
                }
                break;
            }
        }
        return tab;
    }

private transient volatile int sizeCtl;//用于判断是否被其他线程抢占，类似于锁

考虑到线程安全为题，这里利用volatile 修饰的sizeCtl：

如果sizeCtl<0，表示初始化工作已经被其他线程抢走
否则，就通过CAS操作，将sizeCtl变为-1，表示抢占到了锁，在初始化数组，最后将阈值赋值给sizeCtl

初始化工作完成后，就该插入值了：

第一步：如果当前下表位置的值为空，通过CAS操作，将值直接插入到数组中
第二步：当前位置有值，存在hash冲突。通过synchronized对当前节点加锁，保证线程安全
第三步：判断当前节点hash值：如果大于等于0，这代表是链表结构；否则如果该节点类型是红黑树类型，则进行红黑树操作
第四步：添加完数据后，再去判断链表的长度binCount，如果大于8，则转换成红黑树

值插入完毕，就需要通过addCount方法去更新数组的大小了

addCount()更新数组长度

//volatile 修饰，保证可见性
private transient volatile CounterCell[] counterCells;

   @sun.misc.Contended static final class CounterCell {
    
    
        volatile long value;
        CounterCell(long x) {
    
     value = x; }
    }

    final long sumCount() {
    
    
        CounterCell[] as = counterCells; CounterCell a;
        long sum = baseCount;
        if (as != null) {
    
    
            for (int i = 0; i < as.length; ++i) {
    
    
                if ((a = as[i]) != null)
                    sum += a.value;
            }
        }
        return sum;
    }


private final void addCount(long x, int check) {
    
    
		//为了防止多线程同时去增加长度时，一直自旋导致性能man
		//所以多线程时，一个线程一个CounterCell对象
        CounterCell[] as; long b, s;
        //第一部分
        
        //如果counterCells不为空
        //或者CAS更新BASECOUNT失败
        if ((as = counterCells) != null ||
            !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) {
    
    
            //表示有很多线程在抢占更新BASECOUNT值
            CounterCell a; long v; int m;
            //冲突标志，默认是没有冲突
            boolean uncontended = true;
            //如果CounterCell数组为空
            //通过当前线程&CounterCells数组的长度获得下标，且当前下标上没值
            //如果CAS更新当前counterCell对象中value的值失败
            if (as == null || (m = as.length - 1) < 0 ||
                (a = as[ThreadLocalRandom.getProbe() & m]) == null ||
                !(uncontended =
                  U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) {
    
    
                //进入
                fullAddCount(x, uncontended);
                return;
            }
            //链表的长度小于1，不需要扩容
            if (check <= 1)
                return;
             //用BASECOUNT加上所有线程增加的长度，即CounterCell数组中的value值相加+BASECOUNT
            s = sumCount();
        }
//第二部分
        //如果的binCount大于0，需要去检查是否需要扩容
        if (check >= 0) {
    
    
            Node<K,V>[] tab, nt; int n, sc;
            //如果当前数组长度大于阈值sizeCtl，
            //且node数组不为空，
            //且node数组的长度小于默认数组的最大值
            while (s >= (long)(sc = sizeCtl) && (tab = table) != null &&
                   (n = tab.length) < MAXIMUM_CAPACITY) {
    
    
                   //生成一个唯一的扩容戳，高位表示唯一的扩容标记，低位表示参与扩容的线程数
                int rs = resizeStamp(n);
                //如果sizeCtl<0，表示有线程在进行扩容了
                if (sc < 0) {
    
    
                //1. sc >>> RESIZE_STAMP_SHIFT!=rs，判断高位的扩容标记不相同，则不能参与扩容
	            //2. sc == rs + 1，表示扩容已经结束
	            //3.  sc == rs + MAX_RESIZERS ，表示当前帮助扩容的线程数已经达到最大值
	            //4. (nt = nextTable) == null，表示扩容已经结束
	            //5.  transferIndex <= 0，表示所有的 transfer 任务都被领取完了
                    if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
                        sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
                        transferIndex <= 0)
                        break;
                     //cas操作将SIZECTL+1
                    if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
                    //去协助扩容
                        transfer(tab, nt);
                }
                //没有线程在扩容，
                //自己开始扩容，将SIZECTL+2
                else if (U.compareAndSwapInt(this, SIZECTL, sc,
                                             (rs << RESIZE_STAMP_SHIFT) + 2))
                    transfer(tab, null);
                s = sumCount();
            }
        }
    }

这里为了防止多线程同时去增加长度时，一直自旋导致性能变差，所以采用CounterCell数组去管理多个线程所要去增加的长度
addCount方法分为两部分：

第一部分：通过CounterCell数组去更新当前线程需要增加的长度
第二部分：判断Node数组是否需要扩容

先来看第一部分的代码：
如果counterCells不为空，或者CAS更新BASECOUNT失败，表示当前线程竞争激烈，需要通过CounterCell数组去管理

fullAddCount()

private final void fullAddCount(long x, boolean wasUncontended) {
    
    
        int h;
        //生成一个当前线程的随机数
        if ((h = ThreadLocalRandom.getProbe()) == 0) {
    
    
            ThreadLocalRandom.localInit();      // force initialization
            h = ThreadLocalRandom.getProbe();
            wasUncontended = true;
        }
        boolean collide = false;                // True if last slot nonempty
        for (;;) {
    
    
            CounterCell[] as; CounterCell a; int n; long v;
            //如果数组不为空
            if ((as = counterCells) != null && (n = as.length) > 0) {
    
    
            	//当前下标位置等于null
                if ((a = as[(n - 1) & h]) == null) {
    
    
                	//如果cellsBusy =0，表示没线程占用
                    if (cellsBusy == 0) {
    
                // Try to attach new Cell
                    	//初始化CounterCell对象
                        CounterCell r = new CounterCell(x); // Optimistic create
                        //去抢占锁
                        //CAS操作改变CELLSBUSY的值
                        if (cellsBusy == 0 &&
                            U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
    
    
                            //抢到锁，将值插入
                            boolean created = false;
                            try {
    
                   // Recheck under lock
                                CounterCell[] rs; int m, j;
                                if ((rs = counterCells) != null &&
                                    (m = rs.length) > 0 &&
                                    rs[j = (m - 1) & h] == null) {
    
    
                                    rs[j] = r;
                                    created = true;
                                }
                            } finally {
    
    
                            //最后，放开所
                                cellsBusy = 0;
                            }
                            if (created)
                                break;
                            continue;           // Slot is now non-empty
                        }
                    }
                    collide = false;
                }
                //如果之前在外面CAS将当前CounterCell 的值改变失败
                else if (!wasUncontended)       // CAS already known to fail
                	//重新CAS
                    wasUncontended = true;      // Continue after rehash
                 //成功CAS，返回
                else if (U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))
                    break;
                else if (counterCells != as || n >= NCPU)
                    collide = false;            // At max size or stale
                else if (!collide)
                    collide = true;
                 //cellsBusy ==0
                 //且CAS 值CELLSBUSY成功
                else if (cellsBusy == 0 &&
                         U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
    
    
                    try {
    
    
                    	//抢到锁了
                    	//当前线程太多，竞争激烈，需要扩容CounterCell数组
                        if (counterCells == as) {
    
    // Expand table unless stale
                            CounterCell[] rs = new CounterCell[n << 1];
                            for (int i = 0; i < n; ++i)
                                rs[i] = as[i];
                            counterCells = rs;
                        }
                    } finally {
    
    
                        cellsBusy = 0;
                    }
                    collide = false;
                    continue;                   // Retry with expanded table
                }
                h = ThreadLocalRandom.advanceProbe(h);
            }
            //counterCells数组为空
            else if (cellsBusy == 0 && counterCells == as &&
                     U.compareAndSwapInt(this, CELLSBUSY, 0, 1)) {
    
    
                boolean init = false;
                try {
    
                               // Initialize table
                    if (counterCells == as) {
    
    
                    	//初始化一个新的CounterCell数组，默认长度2
                        CounterCell[] rs = new CounterCell[2];
                        rs[h & 1] = new CounterCell(x);
                        counterCells = rs;
                        init = true;
                    }
                } finally {
    
    
                    cellsBusy = 0;
                }
                if (init)
                    break;
            }
            //最后再去尝试一次修改BASECOUNT的值
            else if (U.compareAndSwapLong(this, BASECOUNT, v = baseCount, v + x))
                break;                          // Fall back on using base
        }
    }

这里对CounterCell 数组处理的逻辑主要分为：

如果CounterCell数组不为空，且当前下表位置为空，通过cellsBusy 标志去抢占锁，通过CAS操作将值插入到数组中，最后释放锁
1. 如果CAS赋值失败，表示竞争激烈，需要对CounterCell数组进行扩容，长度是原来的两倍
数组为空，且cellsBusy标记为0，表示没有线程去处理，初始化一个长度为2的CounterCell数组
最后通过CAS再去尝试一下修改BASECOUNT数组的长度

再来看第二部分：如果binCount大于0，就需要检查Node数组是否需要扩容
当Node数组长度大于阈值sizeCtl，且node数组不为空，且node数组的长度小于默认数组的最大值，表示可以扩容了：

如果sizeCtl<0，表示当前有线程在扩容了，紧接着去判断当前线程是否还需要去扩容：
1. sc >>> RESIZE_STAMP_SHIFT!=rs，判断高位的扩容标记不相同，则不能参与扩容
2. sc == rs + 1，表示扩容已经结束
3. sc == rs + MAX_RESIZERS ，表示当前帮助扩容的线程数已经达到最大值
4. (nt = nextTable) == null，表示扩容已经结束
5. transferIndex <= 0，表示所有的 transfer 任务都被领取完了
如果能帮助扩容，通过CAS将sizeCtl+1，调用transfer方法，进行扩容
如果sizeCtl>0，自己开始扩容，将SIZECTL+2

接下来，我们看看扩容方法

transfer()扩容

    private final void transfer(Node<K,V>[] tab, Node<K,V>[] nextTab) {
    
    
        int n = tab.length, stride;
        //通过cpu数去分配数组，保证每个cpu处理的数据一样多
        if ((stride = (NCPU > 1) ? (n >>> 3) / NCPU : n) < MIN_TRANSFER_STRIDE)
            stride = MIN_TRANSFER_STRIDE; // subdivide range
            
            //nextTab 未初始化，nextTab 是用来扩容的 node 数组
        if (nextTab == null) {
    
                // initiating
            try {
    
    
                @SuppressWarnings("unchecked")
                //新建一个扩容后的数组
                Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n << 1];
                //赋值给nextTab 
                nextTab = nt;
            } catch (Throwable ex) {
    
          // try to cope with OOME
            	//出现异常 sizeCtl 默认给Integer最大值
                sizeCtl = Integer.MAX_VALUE;
                return;
            }
            nextTable = nextTab;
            //更新转移下标，表示转移时的下标，比如16
            transferIndex = n;
        }
        //新数组的长度 32
        int nextn = nextTab.length;
        // 创建一个 fwd 节点，表示一个正在被迁移的 Node，并且它的 hash 值为-1(MOVED)，也
		//就是前面我们在讲 putval 方法的时候，会有一个判断 MOVED 的逻辑。它的作用是用来占位，表示
		//原数组中位置 i 处的节点完成迁移以后，就会在 i 位置设置一个 fwd 来告诉其他线程这个位置已经
		//处理过了
        ForwardingNode<K,V> fwd = new ForwardingNode<K,V>(nextTab);
        //推进标识
        boolean advance = true;
        //是否完成扩容的标识
        boolean finishing = false; // to ensure sweep before committing nextTab
        for (int i = 0, bound = 0;;) {
    
    
            Node<K,V> f; int fh;
            while (advance) {
    
    
                int nextIndex, nextBound;
                //bound 标识边界，--i标识下一个处理的节点
                if (--i >= bound || finishing)
                	//处理完毕
                    advance = false;
                 //任务已经分配完毕
                else if ((nextIndex = transferIndex) <= 0) {
    
    
                    i = -1;
                    advance = false;
                }
                //cas操作TRANSFERINDEX，为当前线程分配任务，
                //处理的节点区间(nextBound,nextIndex)->(0,15)
                else if (U.compareAndSwapInt
                         (this, TRANSFERINDEX, nextIndex,
                          nextBound = (nextIndex > stride ?
                                       nextIndex - stride : 0))) {
    
    
                    bound = nextBound;//0
                    i = nextIndex - 1;//15
                    advance = false;
                }
            }
            
            //分配任务完成
            if (i < 0 || i >= n || i + n >= nextn) {
    
    
                int sc;
                //扩容完成
                if (finishing) {
    
    
                	//删除成员变量nextTable ，方便fc
                    nextTable = null;
                    //更新全局变量
                    table = nextTab;
                    //更新阈值
                    sizeCtl = (n << 1) - (n >>> 1);
                    return;
                }
                //CAS 操作对 sizeCtl 的低 16 位进行减 1，代表做完了属于自己的任务
                if (U.compareAndSwapInt(this, SIZECTL, sc = sizeCtl, sc - 1)) {
    
    
                    if ((sc - 2) != resizeStamp(n) << RESIZE_STAMP_SHIFT)
                        return;
                    finishing = advance = true;
                    i = n; // recheck before commit
                }
            }
            // 如果位置 i 处是空的，没有任何节点，那么放入刚刚初始化的 ForwardingNode ”空节点“
            else if ((f = tabAt(tab, i)) == null)
                advance = casTabAt(tab, i, null, fwd);
                //表示该位置已经完成了迁移，也就是如果线程 A 已经处理过这个节点，
                //那么线程 B 处理这个节点时，hash 值一定为 MOVED
            else if ((fh = f.hash) == MOVED)
                advance = true; // already processed
            else {
    
    
            //对该节点加锁
                synchronized (f) {
    
    
                    if (tabAt(tab, i) == f) {
    
    //校验
                        Node<K,V> ln, hn;
                        //链表
                        if (fh >= 0) {
    
    
                            int runBit = fh & n;
                            Node<K,V> lastRun = f;
                            for (Node<K,V> p = f.next; p != null; p = p.next) {
    
    
                                int b = p.hash & n;
                                if (b != runBit) {
    
    
                                    runBit = b;
                                    lastRun = p;
                                }
                            }
                            if (runBit == 0) {
    
    
                                ln = lastRun;
                                hn = null;
                            }
                            else {
    
    
                                hn = lastRun;
                                ln = null;
                            }
                            for (Node<K,V> p = f; p != lastRun; p = p.next) {
    
    
                                int ph = p.hash; K pk = p.key; V pv = p.val;
                                if ((ph & n) == 0)
                                    ln = new Node<K,V>(ph, pk, pv, ln);
                                else
                                    hn = new Node<K,V>(ph, pk, pv, hn);
                            }
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                        //红黑树
                        else if (f instanceof TreeBin) {
    
    
                            TreeBin<K,V> t = (TreeBin<K,V>)f;
                            TreeNode<K,V> lo = null, loTail = null;
                            TreeNode<K,V> hi = null, hiTail = null;
                            int lc = 0, hc = 0;
                            for (Node<K,V> e = t.first; e != null; e = e.next) {
    
    
                                int h = e.hash;
                                TreeNode<K,V> p = new TreeNode<K,V>
                                    (h, e.key, e.val, null, null);
                                if ((h & n) == 0) {
    
    
                                    if ((p.prev = loTail) == null)
                                        lo = p;
                                    else
                                        loTail.next = p;
                                    loTail = p;
                                    ++lc;
                                }
                                else {
    
    
                                    if ((p.prev = hiTail) == null)
                                        hi = p;
                                    else
                                        hiTail.next = p;
                                    hiTail = p;
                                    ++hc;
                                }
                            }
                            ln = (lc <= UNTREEIFY_THRESHOLD) ? untreeify(lo) :
                                (hc != 0) ? new TreeBin<K,V>(lo) : t;
                            hn = (hc <= UNTREEIFY_THRESHOLD) ? untreeify(hi) :
                                (lc != 0) ? new TreeBin<K,V>(hi) : t;
                            setTabAt(nextTab, i, ln);
                            setTabAt(nextTab, i + n, hn);
                            setTabAt(tab, i, fwd);
                            advance = true;
                        }
                    }
                }
            }
        }
    }

transfer 方法主要分为两部分：

第一部分：将数组扩容，并根据CPU数，均匀地分配所有的节点，保证每条线程的处理量一样。即：第一个发起数据迁移的线程会将 transferIndex 指向原数组最后的位置，然后从后往前的 stride 个任务属于第一个线程，然后将 transferIndex 指向新的位置，再往前的 stride 个任务属于第二个线程，依此类推
第二部分：数据迁移

处理链表：和HashMap一样，通过fh & n将链表分为两组，一组的下标和之前的下标一样；另一组的小标是之前的下标+之前数组的长度，最后统一移到两个不同的下标处
处理红黑树的迁移
最后，扩容完毕

与JDK7的区别

锁的使用

JDK7采用分段Segment分段锁，而jdk8采用CAS+Synchronize保证并发安全

数据结构

dk7使用的是数组+链表来实现，而jdk8使用数组+链表+红黑树实现。采用红黑树是为了防止链越来越长导致查询效率越来越低的问题。链表查询时间复杂度：O(n)，红黑树查询时间复杂度：O(logN)

总结

ConcurrentHashMap采用CAS+Synchronize保证并发安全
ConcurrentHashMap不允许key或value值为空
和HashMap一样，ConcurrentHashMap使用数组+单项链表+红黑树实现

深入理解ConcurrentHashMap(JDK8)

前言