难以理解的AQS(下)

在上一篇博客,简单的说下了AQS的基本概念,核心源码解析,但是还有一部分内容没有涉及到,就是AQS对条件变量的支持,这篇博客将着重介绍这方面的内容。

条件变量

基本应用

我们先通过模拟一个消费者/生产者模型来看下条件变量的基本应用:

  • 当有数据的时候,生产者停止生产数据,通知消费者消费数据;
  • 当没有数据的时候,消费者停止消费数据,通知生产者生产数据;
public class CommonResource {
    private boolean isHaveData = false;

    Lock lock = new ReentrantLock();

    Condition producer_con = lock.newCondition();
    Condition consumer_con = lock.newCondition();

    public void product() {
        lock.lock();
        try {
            while (isHaveData) {
                try {
                    System.out.println("还有数据,等待消费数据");
                    producer_con.await();
                } catch (InterruptedException e) {
                }
            }
            System.out.println("生产者生产数据了");
            try {
                TimeUnit.SECONDS.sleep(3);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            isHaveData = true;
            consumer_con.signal();
        } finally {
            lock.unlock();
        }
    }

    public void consume() {
        lock.lock();
        try {
            while (!isHaveData) {
                try {
                    System.out.println("没有数据了,等待生产者消费数据");
                    consumer_con.await();
                } catch (InterruptedException e) {
                }
            }
            System.out.println("消费者消费数据");
            try {
                TimeUnit.SECONDS.sleep(3);
            } catch (InterruptedException e) {
                e.printStackTrace();
            }
            isHaveData = false;
            producer_con.signal();
        } finally {
            lock.unlock();
        }
    }
}
复制代码
public class Main {
    public static void main(String[] args) {
        CommonResource resource = new CommonResource();
        new Thread(() -> {
            while (true) {
                resource.product();
            }
        }).start();

        new Thread(() -> {
            while (true) {
                resource.consume();
            }
        }).start();
    }
}
复制代码

运行结果:

image.png

这就是条件变量的应用,第一反应是不是和object中的wait/nofity很像,wait/nofity是配合synchronized工作的,而条件变量的await/signal是配合使用AQS实现的锁 来完成工作的,当然也要看用AQS实现的锁是否支持了条件变量。synchronized只能与一个共享变量进行工作,而AQS实现的锁支持多个条件变量。

我们试着分析下上面的代码:

首先创建了两个条件变量,一个条件变量用来阻塞/唤醒消费者线程,一个条件变量用来阻塞/唤醒生产者线程。

生产者,首先获取了独占锁,判断是否有数据:

  • 如果有数据,则调用条件变量producer_con的await方法,阻塞当前线程,当消费者线程再次调用该条件变量producer_con的signal方法,就会唤醒该线程。
  • 如果没有数据,则生产数据,并且调用条件变量consumer_con的signal方法,唤醒因为调用consumer_con的await方法而被阻塞的消费者线程。

最终释放锁。

消费者,首先获取了独占锁,判断是否有数据:

  • 如果没有数据,则调用条件变量consumer_con的await方法,阻塞当前线程,当生产者线程再次调用该条件变量consumer_con的signal方法,就会唤醒该线程。
  • 如果有数据,则消费数据,并且调用条件变量producer_con的signal方法,唤醒因为调用producer_con的await方法而被阻塞的生产者线程。

最终释放锁。

这里有两点需要特别注意:

  • 释放锁,一般应该放在finally里面,以防中间出现异常,锁没有被释放。
  • 判断是否有数据,其实用if在绝大部分情况也可以,但是用while更好一些,可以防止虚假唤醒。

为了加深对条件变量的理解,我们再来看一个例子,两个线程交替打印奇偶数:

public class Test {
    private int num = 0;
    private Lock lock = new ReentrantLock();
    Condition condition = lock.newCondition();
    public void add() {
        while(num<100) {
            try {
                lock.lock();
                System.out.println(Thread.currentThread().getName() + ":" + num++);
                condition.signal();
                condition.await();
            } catch (InterruptedException e) {
                e.printStackTrace();
            } finally {
                lock.unlock();
            }
        }
    }
}
复制代码
public class Main {
    public static void main(String[] args) {
        Test test=new Test();
        new Thread(() -> {
            test.add();
        }).start();

        new Thread(() -> {
            test.add();
        }).start();
    }
}
复制代码

运行结果:

image.png

翻阅网上的大多数案例是分两个线程方法交替打印,同时开两个条件变量,其中一个条件变量负责阻塞/唤醒打印奇数的线程,一个变量负责阻塞/唤醒打印偶数的线程,但是个人觉得没什么必要,两个线程共用一个线程方法,共用一个条件变量也可以。不知道各位看官是什么想的?

源码解析

当我们点开lock.newCondition,发现它有好几个实现类:

image.png
我们选择ReentrantLock的实现类,实际上其他实现类也是相同的,只是为了和上面案例中的对应起来,所以先选择ReentrantLock的实现类:

   public Condition newCondition() {
        return sync.newCondition();
    }
复制代码

继续往下点:

        final ConditionObject newCondition() {
            return new ConditionObject();
        }
复制代码

可以看到,当我们调用lock.newnewCondition,最终会new出一个ConditionObject对象,而ConditionObject类是AbstractQueuedSynchronizer的内部类,我们先看下ConditionObject的UML图:

image.png
其中firstWaiter保存的是该条件变量下条件队列的首节点,lastWaiter保存的是该条件变量下条件队列的尾节点。这里只保存了条件队列的首节点和尾节点,中间的节点保存在哪里呢? 让我们点开await方法:

        public final void await() throws InterruptedException {
            if (Thread.interrupted())
                throw new InterruptedException();
            Node node = addConditionWaiter();
            int savedState = fullyRelease(node);
            int interruptMode = 0;
            while (!isOnSyncQueue(node)) {
                LockSupport.park(this);
                if ((interruptMode = checkInterruptWhileWaiting(node)) != 0)
                    break;
            }
            if (acquireQueued(node, savedState) && interruptMode != THROW_IE)
                interruptMode = REINTERRUPT;
            if (node.nextWaiter != null) // clean up if cancelled
                unlinkCancelledWaiters();
            if (interruptMode != 0)
                reportInterruptAfterWait(interruptMode);
        }
复制代码

在这里,我们就搞清楚三个问题即可:

  • 完整的条件队列保存在哪里,以什么方式保存?
  • await方法,是如何释放锁的?
  • await方法,是如何阻塞线程的?

第一个问题在addConditionWaiter方法可以得到答案:

        private Node addConditionWaiter() {
            Node t = lastWaiter;
            // If lastWaiter is cancelled, clean out.
            if (t != null && t.waitStatus != Node.CONDITION) {
                unlinkCancelledWaiters();
                t = lastWaiter;
            }
            Node node = new Node(Thread.currentThread(), Node.CONDITION);
            if (t == null)
                firstWaiter = node;
            else
                t.nextWaiter = node;
            lastWaiter = node;
            return node;
        }
复制代码

首先是判断条件队列中的尾节点是否被取消了,如果被取消了,执行unlinkCancelledWaiters方法。我们这里肯定没有被取消,事实上,如果是第一次调用await方法,lastWaiter是为空的,所以肯定不会进入第一个if。随后,新建一个Node,这个Node类就是上一篇博客中大量介绍过的,也是AbstractQueuedSynchronizer的内部类,也就是新建了一个Node节点,其中保存了当前线程和Node的类型,这里Node的类型是CONDITION,如果t==null,则说明新建的Node是第一个节点,所以赋值给firstWaiter ,否则将尾节点的nextWaiter设置为新Node,形成一个单向链表,这个nextWaiter在哪里呢,它是通过node点出来的,也就是它也属于node类的一个字段:

image.png
这说明了一个比较重要的问题: AQS的阻塞队列是以双向的链表的形式保存的,是通过prev和next建立起关系的,但是AQS中的条件队列是以单向链表的形式保存的,是通过nextWaiter建立起关系的,也就是AQS的阻塞队列和AQS中的条件队列并非同一个队列。

其实,AQS中的条件队列也是一个阻塞队列,只是为了方便,所以在本篇博客中出现的AQS中的条件队列特指在被条件变量await的,而阻塞队列特指FIFO双向链表队列。

第一个问题解决了,我们再来看第二个问题,第二个问题答案在await的第二个方法:

    final int fullyRelease(Node node) {
        boolean failed = true;
        try {
            int savedState = getState();
            if (release(savedState)) {
                failed = false;
                return savedState;
            } else {
                throw new IllegalMonitorStateException();
            }
        } finally {
            if (failed)
                node.waitStatus = Node.CANCELLED;
        }
    }
复制代码

首先调用getState方法,这个state是什么,不知大家是否还有印象,对于ReentrantLock来说,state就是重入次数,随后调用release方法,传入state。也就是不管重入了多少次,这里是一次性把锁完全释放掉。

    public final boolean release(int arg) {
        if (tryRelease(arg)) {
            Node h = head;
            if (h != null && h.waitStatus != 0)
                unparkSuccessor(h);
            return true;
        }
        return false;
    }
复制代码

可以看到释放锁还是调用了tryRelease方法,这个方法正是需要被重写的。

当完成了前两个方法的调用后,就会进行一个判断isOnSyncQueue,一般来说会进入这个if,park这个线程,等待唤醒,这就解决了第三个问题。

下面我们再来看看signal方法,同样的,我们需要解决几个问题:

  • AQS的条件队列和阻塞队列既然不是同一个队列,那么是不是被await的线程永远不会进入阻塞队列?
  • signal方法是如何唤醒线程的?
        public final void signal() {
            if (!isHeldExclusively())
                throw new IllegalMonitorStateException();
            Node first = firstWaiter;
            if (first != null)
                doSignal(first);
        }
复制代码

重点在于doSignal中的transferForSignal方法:

    final boolean transferForSignal(Node node) {
        /*
         * If cannot change waitStatus, the node has been cancelled.
         */
        if (!compareAndSetWaitStatus(node, Node.CONDITION, 0))
            return false;

        /*
         * Splice onto queue and try to set waitStatus of predecessor to
         * indicate that thread is (probably) waiting. If cancelled or
         * attempt to set waitStatus fails, wake up to resync (in which
         * case the waitStatus can be transiently and harmlessly wrong).
         */
        Node p = enq(node);
        int ws = p.waitStatus;
        if (ws > 0 || !compareAndSetWaitStatus(p, ws, Node.SIGNAL))
            LockSupport.unpark(node.thread);
        return true;
复制代码

在这个方法中,我们可以会调用enq方法,把条件队列的线程放入阻塞队列中,然后调用unpark方法,唤醒线程。

本篇博客到这里也结束了。

经过上下两篇博客,相信大家对AQS一定有了一个比较浅显的理解。聪明的你,可以看出来,其实这两篇博客有很多内容都没有讲透,甚至有点模棱两可,只是“蜻蜓点水”,所以这也符合了我的标题:难以理解的AQS。的确,AQS要深入研究的话,不比线程池简单多少。看,我又再给自己找理由了。希望经过今后的沉淀,我可以把这两篇博客重写下,然后换个标题“彻底理解AQS”,嘿嘿。

猜你喜欢

转载自juejin.im/post/5ca025cfe51d455ca149adf4
今日推荐