转自 https://blog.csdn.net/firefile/article/details/80747569
本文目录:
- 概述
- 验证
- 剖析
- 小结
- 概述
线程池可以把线程复用起来,减少线程创建销毁的时间和资源消耗,提高了程序任务执行的吞吐率。
就像线程属于全局使用的资源一样,线程池一般也是全局性,对整个应用进程的线程复用做有效的管理。设计者一般都会把线程池作为类的静态成员或者单例成员,存活于整个进程的生命周期。
但是还是例外地看到了类似这样的代码。
比如放到了方法体中作为局部变量:
private static void sampleFunc() {
ExecutorService executor = Executors.newFixedThreadPool(10);
for (int i = 0; i < 100; i++) {
executor.execute(new Runnable() {
@Override
public void run() {
...
}
});
}
}
又或者放入了生命周期短的对象中,作为它的成员变量:
public class SampleClass {
...
private final ExecutorService mExecutor = Executors.newFixedThreadPool(2);
...
}
这些线程池的使用看起来挺正常的,隐藏着一个很严重的问题:
当对象实例不再使用或者方法执行完毕后,什么时候会释放线程 ,关闭线程池?
不同的线程池表现不一样。主要看是否设置了核心线程数。
- 如果没有设置核心线程数,比如 newCachedThreadPool ,在线程池的线程空闲时间到达 60s 后,线程会关闭,所有线程关闭后线程池也相应关闭回收。
- 如果设置了核心线程数,比如 newSingleThreadExecutor 和 newFixedThreadPool ,如果没有主动去关闭,或者设置核心线程的超时时间,核心线程会一直存在不会被关闭,这个线程池就不会被释放回收。
2. 验证
我们设计一个 Demo 来验证一下:
- 选用 JDK 提供的单线程线程池,这个线程池的核心线程数为 1。
- 该线程池作为一个对象的成员变量。
- 这个类的实例对象在方法体中执行,外界对它没有引用
- 最后调用一下 System.gc 主动回收
- 等待一段时间后,打印出进程的堆信息,查看相关的类。
按照上面的思路,创建了 SimpleClass:
public class SimpleClass {
private final int mIndex;
private Executor mExecutors = Executors.newSingleThreadExecutor();
public SimpleClass(int index) {
mIndex = index;
}
public void runTask() {
mExecutors.execute(new Runnable() {
@Override
public void run() {
System.out.println("[" + mIndex + "] execute");
}
});
}
}
然后在 main 方法里执行
public class TestThreadLife {
public static void main(String[] args) {
test();
System.gc();
}
private static void test() {
for (int i = 0; i < 10; i++) {
new SimpleClass(i).runTask();
}
}
}
过一段时间后,使用 JDK 的工具来获取当前存活的对象信息:
- jps 打印获取进程号 4540
- 调用 jmap -histo 4540 读取堆中的对象信息。
可以在控制台看到这样的记录:
E:\code\workspace-demo\TestJava>jmap -histo 4540
num #instances #bytes class name
----------------------------------------------
...
10: 20 7520 java.lang.Thread
...
52: 10 480 java.util.concurrent.LinkedBlockingQueue
53: 10 480 java.util.concurrent.ThreadPoolExecutor$Worker
54: 30 480 java.util.concurrent.locks.ReentrantLock
...
218: 1 16 com.intellij.rt.execution.application.AppMain$1
219: 1 16 concurrent.threadpool.TestThreadLife.SimpleClass
...
Total 9740 33368472
经过一段时间,再加上主动调用 GC,10 个 SimpleClass 实例已经基本被回收了,但是 10 个 ThreadPoolExecutor 的实例依然还在。
这就是我们上面提到的,带有核心线程的 ThreadPoolExecutor,如果没有主动释放或者设置线程超时,如果放在成员变量中,会发生对象实例泄漏。
同样,放在方法体中做局部变量也会有这样的问题。
3. 剖析
为什么会有这样的现象?
线程池无法被回收,是因为线程池的引用被它的内部类 Worker 持有了。而 Worker 和线程一一对应,是对 Thread 的增强,所以本质上就是因为线程没有被释放。
那么任务队列已经空了,并且外界也没有任务过来,线程为什么还没有被释放?
看 ThreadPoolExecutor 的 runWorker方法:
final void runWorker(Worker w) {
Thread wt = Thread.currentThread();
Runnable task = w.firstTask;
w.firstTask = null;
w.unlock(); // allow interrupts
boolean completedAbruptly = true;
try {
while (task != null || (task = getTask()) != null) {
w.lock();
// If pool is stopping, ensure thread is interrupted;
// if not, ensure thread is not interrupted. This
// requires a recheck in second case to deal with
// shutdownNow race while clearing interrupt
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
beforeExecute(wt, task);
Throwable thrown = null;
try {
task.run();
} catch (RuntimeException x) {
thrown = x; throw x;
} catch (Error x) {
thrown = x; throw x;
} catch (Throwable x) {
thrown = x; throw new Error(x);
} finally {
afterExecute(task, thrown);
}
} finally {
task = null;
w.completedTasks++;
w.unlock();
}
}
completedAbruptly = false;
} finally {
processWorkerExit(w, completedAbruptly);
}
}
我们看到要执行线程退出 processWorkerExit 需要这几种情况:
- 线程池的状态 >= STOP
- getTask 获取到空任务
第一个条件,线程池的状态要达到 STOP,需要调用 shutdown 或者 shutdownNow 方法,我们不满足。
第二个条件,getTask 获取到空任务,继续看 getTask 的代码:
private Runnable getTask() {
boolean timedOut = false; // Did the last poll() time out?
for (;;) {
int c = ctl.get();
int rs = runStateOf(c);
// Check if queue empty only if necessary.
if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
int wc = workerCountOf(c);
// Are workers subject to culling?
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
try {
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
if (r != null)
return r;
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
任务队列使用的是阻塞队列 BlockingQueue,该队列提供了两种方法来获取任务:
- poll,可以设置超时时间,当超时后会得到一个空任务。
- take,阻塞住,直到有任务出现。
从上面的 getTask 方法中我们可以看到:
- 当前线程数大于核心线程,会调用 poll,超时后返回空任务。
- 当前线程数小于等于核心线程,并且调用了 allowCoreThreadTimeOut 方法允许核心线程超时关闭的情况下,也是调用 poll,超时后返回空任务。
- 其他情况,调用 take 阻塞等待。
我们上面使用单个核心线程的线程池,在没有任务的情况下,核心线程正处于 getTask ,调用阻塞队列 BlockingQueue 的 take 方法阻塞等待获取到任务,从而导致线程池包括里面的核心线程迟迟不被关闭并且回收。
4. 小结
像上面那样去设置线程池,可以理解为线程池的局部应用。
不推荐用这样的方式,因为局部线程池能做到的事情,全局线程池也可以做到。而且全局单例的线程池还可以不用考虑关闭线程池的问题,毕竟生命周期和进程一致。
如果业务场景非要这样用的话,并且线程池有核心线程的情况下,要注意做两件事情防止对象泄漏:
- 对核心线程设置超时时间。
- 主动调用 shutdown 或 shutdownNow 来关闭线程池。