线程池踩坑 - 作为实例成员或方法局部变量的误区

转自 https://blog.csdn.net/firefile/article/details/80747569

本文目录：

概述
验证
剖析
小结
概述

线程池可以把线程复用起来，减少线程创建销毁的时间和资源消耗，提高了程序任务执行的吞吐率。

就像线程属于全局使用的资源一样，线程池一般也是全局性，对整个应用进程的线程复用做有效的管理。设计者一般都会把线程池作为类的静态成员或者单例成员，存活于整个进程的生命周期。

但是还是例外地看到了类似这样的代码。

比如放到了方法体中作为局部变量：

private static void sampleFunc() {
    ExecutorService executor = Executors.newFixedThreadPool(10);
    for (int i = 0; i < 100; i++) {
        executor.execute(new Runnable() {
            @Override
            public void run() {
                ...
            }
        });
    }
}

又或者放入了生命周期短的对象中，作为它的成员变量：

public class SampleClass {
    ...
    private final ExecutorService mExecutor = Executors.newFixedThreadPool(2);
    ...
}

这些线程池的使用看起来挺正常的，隐藏着一个很严重的问题：

当对象实例不再使用或者方法执行完毕后，什么时候会释放线程，关闭线程池？

不同的线程池表现不一样。主要看是否设置了核心线程数。

如果没有设置核心线程数，比如 newCachedThreadPool ，在线程池的线程空闲时间到达 60s 后，线程会关闭，所有线程关闭后线程池也相应关闭回收。
如果设置了核心线程数，比如 newSingleThreadExecutor 和 newFixedThreadPool ，如果没有主动去关闭，或者设置核心线程的超时时间，核心线程会一直存在不会被关闭，这个线程池就不会被释放回收。

2. 验证

我们设计一个 Demo 来验证一下：

选用 JDK 提供的单线程线程池，这个线程池的核心线程数为 1。
该线程池作为一个对象的成员变量。
这个类的实例对象在方法体中执行，外界对它没有引用
最后调用一下 System.gc 主动回收
等待一段时间后，打印出进程的堆信息，查看相关的类。

按照上面的思路，创建了 SimpleClass：

public class SimpleClass {
    private final int mIndex;
    private Executor mExecutors = Executors.newSingleThreadExecutor();

    public SimpleClass(int index) {
        mIndex = index;
    }

    public void runTask() {
        mExecutors.execute(new Runnable() {
            @Override
            public void run() {
                System.out.println("[" + mIndex + "] execute");
            }
        });
    }
}

然后在 main 方法里执行

public class TestThreadLife {
    public static void main(String[] args) {
        test();
        System.gc();
    }
    private static void test() {
        for (int i = 0; i < 10; i++) {
            new SimpleClass(i).runTask();
        }
    }
}

过一段时间后，使用 JDK 的工具来获取当前存活的对象信息：

jps 打印获取进程号 4540
调用 jmap -histo 4540 读取堆中的对象信息。

可以在控制台看到这样的记录：

E:\code\workspace-demo\TestJava>jmap -histo 4540

 num     #instances         #bytes  class name
----------------------------------------------
...
  10:            20           7520  java.lang.Thread
...
  52:            10            480  java.util.concurrent.LinkedBlockingQueue
  53:            10            480  java.util.concurrent.ThreadPoolExecutor$Worker
  54:            30            480  java.util.concurrent.locks.ReentrantLock
...  
 218:             1             16  com.intellij.rt.execution.application.AppMain$1
 219:             1             16  concurrent.threadpool.TestThreadLife.SimpleClass
... 
Total          9740       33368472

经过一段时间，再加上主动调用 GC，10 个 SimpleClass 实例已经基本被回收了，但是 10 个 ThreadPoolExecutor 的实例依然还在。

这就是我们上面提到的，带有核心线程的 ThreadPoolExecutor，如果没有主动释放或者设置线程超时，如果放在成员变量中，会发生对象实例泄漏。

同样，放在方法体中做局部变量也会有这样的问题。

3. 剖析

为什么会有这样的现象？

线程池无法被回收，是因为线程池的引用被它的内部类 Worker 持有了。而 Worker 和线程一一对应，是对 Thread 的增强，所以本质上就是因为线程没有被释放。

那么任务队列已经空了，并且外界也没有任务过来，线程为什么还没有被释放？

看 ThreadPoolExecutor 的 runWorker方法：

final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                w.lock();
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &&
                      runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                    wt.interrupt();
                try {
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    try {
                        task.run();
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);
                    }
                } finally {
                    task = null;
                    w.completedTasks++;
                    w.unlock();
                }
            }
            completedAbruptly = false;
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

我们看到要执行线程退出 processWorkerExit 需要这几种情况：

线程池的状态 >= STOP
getTask 获取到空任务

第一个条件，线程池的状态要达到 STOP，需要调用 shutdown 或者 shutdownNow 方法，我们不满足。

第二个条件，getTask 获取到空任务，继续看 getTask 的代码：

private Runnable getTask() {
        boolean timedOut = false; // Did the last poll() time out?

        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

            // Check if queue empty only if necessary.
            if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
                decrementWorkerCount();
                return null;
            }

            int wc = workerCountOf(c);

            // Are workers subject to culling?
            boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

            if ((wc > maximumPoolSize || (timed && timedOut))
                && (wc > 1 || workQueue.isEmpty())) {
                if (compareAndDecrementWorkerCount(c))
                    return null;
                continue;
            }

            try {
                Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
                if (r != null)
                    return r;
                timedOut = true;
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }

任务队列使用的是阻塞队列 BlockingQueue，该队列提供了两种方法来获取任务：

poll，可以设置超时时间，当超时后会得到一个空任务。
take，阻塞住，直到有任务出现。

从上面的 getTask 方法中我们可以看到：

当前线程数大于核心线程，会调用 poll，超时后返回空任务。
当前线程数小于等于核心线程，并且调用了 allowCoreThreadTimeOut 方法允许核心线程超时关闭的情况下，也是调用 poll，超时后返回空任务。
其他情况，调用 take 阻塞等待。

我们上面使用单个核心线程的线程池，在没有任务的情况下，核心线程正处于 getTask ，调用阻塞队列 BlockingQueue 的 take 方法阻塞等待获取到任务，从而导致线程池包括里面的核心线程迟迟不被关闭并且回收。

4. 小结

像上面那样去设置线程池，可以理解为线程池的局部应用。

不推荐用这样的方式，因为局部线程池能做到的事情，全局线程池也可以做到。而且全局单例的线程池还可以不用考虑关闭线程池的问题，毕竟生命周期和进程一致。

如果业务场景非要这样用的话，并且线程池有核心线程的情况下，要注意做两件事情防止对象泄漏：

对核心线程设置超时时间。
主动调用 shutdown 或 shutdownNow 来关闭线程池。