Executor Framework分析 (二) ThreadPoolExecutor主要参数分析

本篇博客主要记录ThreadPoolExecutor主要参数的含义，
并分析相关接口的具体实现。

很多时候，当我们不需要指定线程池的运行细节时，
会直接利用工具类Executors创建线程池，例如：

public class Executors {
    //创建固定大小的线程池
    public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
    }

    ........

    //创建可复用的线程池
    public static ExecutorService newCachedThreadPool(ThreadFactory threadFactory) {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>(),
                                      threadFactory);
    }

    ......
}

从上述代码可以看出，Executors提供的方法，
实际上就是调用了ThreadPoolExecutor的构造函数，
只不过传入了不同的参数。

因此，我们有必要分析下ThreadPoolExecutor的构造函数，
了解下参数的具体含义，以便分析ThreadPoolExecutor的设计意图。

ThreadPoolExecutor的构造函数如下所示：

    public ThreadPoolExecutor(int corePoolSize,
                              int maximumPoolSize,
                              long keepAliveTime,
                              TimeUnit unit,
                              BlockingQueue<Runnable> workQueue,
                              ThreadFactory threadFactory,
                              RejectedExecutionHandler handler) {
        ...................
    }

接下来，我们来看看每个参数的含义。

一、corePoolSize和maximumPoolSize
corePoolSize和maximumPoolSize决定了线程池创建线程的方式和数量。

根据ThreadPoolExecutor的描述来看：
当新的任务被提交给线程池时，线程池会查看当前线程的数量。

如果当前线程的数量小于corePoolSize时，那么线程池就会创建出新的线程，
即使此时有空闲的线程存在。

如果当前线程的数量大于等于corePoolSize，且小于maximumPoolSize，
只有线程池的缓存队列满了时，才会创建新的线程。

为了验证这段描述，我们可以看看相关的源码：

public class ThreadPoolExecutor extends AbstractExecutorService {
    .........
    public void execute(Runnable command) {
        .......
        int c = ctl.get();
        //当前线程数小于corePoolSize时，
        if (workerCountOf(c) < corePoolSize) {
            //直接addWorker，增加线程，参数为true
            if (addWorker(command, true))
                return;
            c = ctl.get();
        }

        //线程数大于corePoolSize时，先尝试将task加入队列workQueue
        if (isRunning(c) && workQueue.offer(command)) {
            ..............
        }
        //加入队列失败后，即队列是满的，同样调用addWorker方法
        //参数为false
        else if (!addWorker(command, false))
            //创建失败，调用reject函数处理
            reject(command);
    }

    ...............

我们跟进一下addWorker函数：

    private boolean addWorker(Runnable firstTask, boolean core) {
        retry:
        for (;;) {
            int c = ctl.get();
            ...........
            for (;;) {
                //得到当前线程数量
                int wc = workerCountOf(c);

                //若参数为true时，表示创建核心线程，总数必须小于corePoolSize
                //若参数为false时，表示创建非核心线程，总数必须小于maximumPoolSize
                if (wc >= CAPACITY ||
                    wc >= (core ? corePoolSize : maximumPoolSize))
                    return false;

                //增加线程数量，利用标号跳出循环
                if (compareAndIncrementWorkerCount(c))
                    break retry;
                ...............
            }
        }

        //创建实际的worker，即工作线程
        ..............
    }
    ................
}

从上面的代码可以看出，当ThreadPoolExecutor收到新的任务时，
即execute接口被调用后，才会调用addWorker函数创建线程。

如果想尽快地创建出核心线程，ThreadPoolExecutor提供了
prestartCoreThread和prestartAllCoreThreads函数，如下所示：

public class ThreadPoolExecutor extends AbstractExecutorService {
    ..........
    //创建一个core thread
    public boolean prestartCoreThread() {
        return workerCountOf(ctl.get()) < corePoolSize &&
            addWorker(null, true);
    }
    ..........
    //创建出所有的core thread
    public int prestartAllCoreThreads() {
        int n = 0;
        while (addWorker(null, true))
            ++n;
        return n;
    }
    ..........
}

二、keepAliveTime
当线程的数量超过corePoolSize后，为了减少对系统资源的消耗，
一旦线程池发现某个线程空闲的时间超过了keepAliveTime，
就会主动结束该空闲线程，以释放系统资源。

一般情况下，只有线程数量超过corePoolSize时，
才会试图回收空闲线程的资源(线程数量小于corePoolSize时，停止回收）。
不过，如果线程池调用了allowCoreThreadTimeOut接口，
则可以回收所有空闲的线程资源线程。

接下来，我们来看看对应的代码：

public class ThreadPoolExecutor extends AbstractExecutorService {
    ...............
    //我们仍然从addWorker入手
    private boolean addWorker(Runnable firstTask, boolean core) {
        .........
        boolean workerStarted = false;
        boolean workerAdded = false;
        Worker w = null;
        try {
            //创建worker， 并得到其中的thread
            w = new Worker(firstTask);
            final Thread t = w.thread;

            if (t != null) {
                //判断线程池状态，决定是否能增加worker
                ..............
                if (workerAdded) {
                    //若增加了worker，则调用对应线程的start方法
                    t.start();
                    workerStarted = true;
                }
            }
        } .........
        ...........
    }
    ............

我们看看Worker类的实现：

    //Worker实现了Runnable接口
    private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable
    {
        ..........
        Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask;

            //调用getThreadFactory获取ThreadPoolExecutor对应的ThreadFactory
            //创建thread时，传入了worker作为runnable
            //因此，前文的线程start后，会调用worker的run方法
            this.thread = getThreadFactory().newThread(this);
        }

        public void run() {
            //继续跟进runWorker函数
            runWorker(this);
        }
        .........
    }

跟进一下runWorker函数：

    ............

    final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                //不断获取task并执行
                ............
            }
            completedAbruptly = false;
        } finally {
            //没有task可执行时，就会移除worker，即回收对应的资源
            processWorkerExit(w, completedAbruptly);
        }
    }
    ............
}

从上面的代码可以看出，worker被创建后就会一直获取Task来执行。
如果获取不到task，worker就会被移除，对应的线程将会被回收。

最后，我们跟进一下getTask函数：

private Runnable getTask() {
    boolean timedOut = false;

    for (;;) {
        ...........
        int wc = workerCountOf(c);

        //在不调用allowCoreThreadTimeOut的条件下
        //线程池中线程数量大于corePoolSize时，就会判断生存时间
        //调用了allowCoreThreadTimeOut后，可将allowCoreThreadTimeOut置为true
        //所有线程都需要判断生存时间
        boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

        //这里我们关注timedOut
        //后面的代码决定了它的值
        if ((wc > maximumPoolSize || (timed && timedOut))
            && (wc > 1 || workQueue.isEmpty())) {
            if (compareAndDecrementWorkerCount(c))
                return null;
            continue;
        }

        try {
            //从workQueue中取出待执行的task
            //此处说明，当需要判断生存时间时，仅等待keepAliveTime
            Runnable r = timed ?
                workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                workQueue.take();
            if (r != null)
                return r;
            //没获取到task时，将timedOut置为true
            //于是下一轮for循环时，return null
            timedOut = true;
        } catch (InterruptedException retry) {
            timedOut = false;
        }
    }
}

根据上面的代码应该不难理解keepAliveTime的含义。
线程池中的线程创建出来后，都是不断地尝试从同一个workQueue中获取任务。
keepAliveTime就是控制线程空闲时的生命周期。

三、WorkQueue
WorkQueue主要用于保存提交到线程池的任务。

根据第一部分提及的execute函数的源码，
我们可以得出以下结论：
1、当线程数量小于corePoolSize时，线程池会优先创建线程，
不会将任务加入到WorkQueue中；
2、当线程数大于corePoolSize时，线程池会优先将任务加入到WorkQueue中，
而不是创建新的线程；
3、当WorkQueue中任务数量达到上限时，线程池才会继续创建线程，
直到线程数达到maximumPoolSize；
4、如果线程数达到了maximumPoolSize，且WorkQueue中任务数量达到上限，
那么新来的任务将被丢弃掉。

常用的WorkQueue类型主要有以下三种：
3.1 无缓冲的队列
这种队列的代表是SynchronousQueue，其特点是：
收到任务后，会立即转交给工作线程处理，即队列本身不会缓存任务。

当线程池使用该类型队列时，如果有新任务到来，
但没有空闲线程，那么会立即尝试创建新的线程。
因此使用这种类型的队列时，为了避免任务被拒绝掉，
maximumPoolSizes一般被设置为Integer.MAX_VALUE。

3.2 无限缓存容量的队列
这种队列的代表是不设置容量上限的LinkedBlockingQueue(容量的上限比较大)。

当线程池使用该类型队列时，一旦线程的数量达到corePoolSize，
那么新到来的任务就会被加入到队列中。
于是，线程池创建线程的数量上限就是corePoolSize(maximumPoolSize没有意义)。

3.3 有限容量的队列
这种队列的代表是ArrayBlockingQueue。

当线程池使用该类型队列时，处理任务的行为，
与第三部分开头描述的完全一致。
即在队列满时，线程池就需要创建新的线程，
直到线程数量达到maximumPoolSizes。

容易看出，使用有限容量队列可以有效地节省系统资源。
不过，需要仔细平衡队列容量和maximumPoolSizes的值：
当队列容量较大，maximumPoolSizes较小时，虽然可以降低CPU使用率，
降低消耗的系统资源及线程切换带来的开销，不过此时工作的吞吐率将会降低；
相对地，当队列容量较小，就需要更大的maximumPoolSizes，
此时会提高CPU使用率，但增大线程切换的开销。

四、ThreadFactory
ThreadFactory负责创建实际的线程。

我们直接看Worker类相关的代码：

public class ThreadPoolExecutor extends AbstractExecutorService {
    ............
    private final class Worker
        extends AbstractQueuedSynchronizer
        implements Runnable
    {
        ..........
        Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask;
            //调用getThreadFactory获取ThreadPoolExecutor对应的ThreadFactory
            this.thread = getThreadFactory().newThread(this);
        }
        .........
    }
    ............
}

利用工具类Executors创建ThreadPoolExecutor时，
如果不显示指定，一般默认使用DefaultThreadFactory。

public class Executors {
    ..........
    private static class DefaultThreadFactory implements ThreadFactory {
        private static final AtomicInteger poolNumber = new AtomicInteger(1);
        private final ThreadGroup group;
        private final AtomicInteger threadNumber = new AtomicInteger(1);
        private final String namePrefix;

        //决定了线程的group， 名称前缀
        DefaultThreadFactory() {
            SecurityManager s = System.getSecurityManager();
            group = (s != null) ? s.getThreadGroup() :
                                  Thread.currentThread().getThreadGroup();
            namePrefix = "pool-" +
                          poolNumber.getAndIncrement() +
                         "-thread-";
        }

        //创建实际线程的方法
        public Thread newThread(Runnable r) {
            Thread t = new Thread(group, r,
                                  namePrefix + threadNumber.getAndIncrement(),
                                  0);

            //强行定义了thread的daemon属性及优先级
            if (t.isDaemon())
                t.setDaemon(false);
            if (t.getPriority() != Thread.NORM_PRIORITY)
                t.setPriority(Thread.NORM_PRIORITY);
            return t;
        }
    }
    ..........
}

可以根据需求，自行定义ThreadFactory。

五、RejectedExecutionHandler
RejectedExecutionHandler主要负责处理被拒绝的任务。

从第一部分execute的代码，我们知道当任务处理失败时，
将会调用reject方法：

public class ThreadPoolExecutor extends AbstractExecutorService {
    ..........
    final void reject(Runnable command) {
        //调用RejectedExecutionHandler的rejectedExecution方法
        handler.rejectedExecution(command, this);
    }
    ..........
}

常见的RejectedExecutionHandler有以下几种：
5.1 AbortPolicy

public static class AbortPolicy implements RejectedExecutionHandler {
    ..........
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        throw new RejectedExecutionException("Task " + r.toString() +
                                             " rejected from " +
                                             e.toString());
    }
}

容易看出使用AbortPolicy时，一旦遇到任务无法处理的情况，将直接抛出异常。

5.2 CallerRunsPolicy

public static class CallerRunsPolicy implements RejectedExecutionHandler {
    ..........
    //调用线程池的execute方法时， 才有可能被拒绝，从而执行rejectedExecution方法
    //这是一个同步的过程，因此r.run将执行在调用者所在的线程中
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        //调用前提是线程池没有被shutdown
        if (!e.isShutdown()) {
            r.run();
        }
    }
}

顾名思义，当使用CallerRunsPolicy时，一旦遇到任务无法处理的情况，
任务将直接在调用线程中执行。
因此使用CallerRunsPolicy时，最好不要在类似UI线程里直接执行execute函数，
避免UI线程被任务阻塞。

5.3 DiscardPolicy

public static class DiscardPolicy implements RejectedExecutionHandler {
    ............
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        //直接丢弃
    }
}

当使用DiscardPolicy时，一旦遇到任务无法处理的情况，线程池直接丢弃该任务。

5.4 DiscardOldestPolicy

public static class DiscardOldestPolicy implements RejectedExecutionHandler {
    ............
    public void rejectedExecution(Runnable r, ThreadPoolExecutor e) {
        if (!e.isShutdown()) {
            //移除workQueue中最前面的任务
            e.getQueue().poll();
            //重新调用execute，仍然有可能触发rejectedExecution
            e.execute(r);
        }
    }
}

当使用DiscardOldestPolicy时，一旦遇到任务无法处理的情况，
线程池直接将丢弃任务队列中最旧的任务，并重新调用execute接口处理任务。

六、总结
至此，我们已经分析完了ThreadPoolExecutor主要参数的含义。

结合参数的含义，分析ThreadPoolExecutor的execute函数，
应该比较容易掌握ThreadPoolExecutor的工作原理。

下一篇博客，我们再来分析ThreadPoolExecutor中其它值得一看的代码。

Executor Framework分析 (二) ThreadPoolExecutor主要参数分析

猜你喜欢