线程池踩坑 - 作为实例成员或方法局部变量的误区

转自 https://blog.csdn.net/firefile/article/details/80747569

本文目录:

  1. 概述
  2. 验证
  3. 剖析
  4. 小结
  5. 概述

线程池可以把线程复用起来,减少线程创建销毁的时间和资源消耗,提高了程序任务执行的吞吐率。

就像线程属于全局使用的资源一样,线程池一般也是全局性,对整个应用进程的线程复用做有效的管理。设计者一般都会把线程池作为类的静态成员或者单例成员,存活于整个进程的生命周期。

但是还是例外地看到了类似这样的代码。

比如放到了方法体中作为局部变量:

private static void sampleFunc() {
    ExecutorService executor = Executors.newFixedThreadPool(10);
    for (int i = 0; i < 100; i++) {
        executor.execute(new Runnable() {
            @Override
            public void run() {
                ...
            }
        });
    }
}

又或者放入了生命周期短的对象中,作为它的成员变量:

public class SampleClass {
    ...
    private final ExecutorService mExecutor = Executors.newFixedThreadPool(2);
    ...
}

这些线程池的使用看起来挺正常的,隐藏着一个很严重的问题:

当对象实例不再使用或者方法执行完毕后,什么时候会释放线程 ,关闭线程池?

不同的线程池表现不一样。主要看是否设置了核心线程数。

  1. 如果没有设置核心线程数,比如 newCachedThreadPool ,在线程池的线程空闲时间到达 60s 后,线程会关闭,所有线程关闭后线程池也相应关闭回收。
  2. 如果设置了核心线程数,比如 newSingleThreadExecutor 和 newFixedThreadPool ,如果没有主动去关闭,或者设置核心线程的超时时间,核心线程会一直存在不会被关闭,这个线程池就不会被释放回收。

2. 验证

我们设计一个 Demo 来验证一下:

  1. 选用 JDK 提供的单线程线程池,这个线程池的核心线程数为 1。
  2. 该线程池作为一个对象的成员变量。
  3. 这个类的实例对象在方法体中执行,外界对它没有引用
  4. 最后调用一下 System.gc 主动回收
  5. 等待一段时间后,打印出进程的堆信息,查看相关的类。

按照上面的思路,创建了 SimpleClass:

public class SimpleClass {
    private final int mIndex;
    private Executor mExecutors = Executors.newSingleThreadExecutor();

    public SimpleClass(int index) {
        mIndex = index;
    }

    public void runTask() {
        mExecutors.execute(new Runnable() {
            @Override
            public void run() {
                System.out.println("[" + mIndex + "] execute");
            }
        });
    }
}

然后在 main 方法里执行

public class TestThreadLife {
    public static void main(String[] args) {
        test();
        System.gc();
    }
    private static void test() {
        for (int i = 0; i < 10; i++) {
            new SimpleClass(i).runTask();
        }
    }
}
 

过一段时间后,使用 JDK 的工具来获取当前存活的对象信息:

  1. jps 打印获取进程号 4540
  2. 调用 jmap -histo 4540 读取堆中的对象信息。

可以在控制台看到这样的记录:

E:\code\workspace-demo\TestJava>jmap -histo 4540

 num     #instances         #bytes  class name
----------------------------------------------
...
  10:            20           7520  java.lang.Thread
...
  52:            10            480  java.util.concurrent.LinkedBlockingQueue
  53:            10            480  java.util.concurrent.ThreadPoolExecutor$Worker
  54:            30            480  java.util.concurrent.locks.ReentrantLock
...  
 218:             1             16  com.intellij.rt.execution.application.AppMain$1
 219:             1             16  concurrent.threadpool.TestThreadLife.SimpleClass
... 
Total          9740       33368472 

经过一段时间,再加上主动调用 GC,10 个 SimpleClass 实例已经基本被回收了,但是 10 个 ThreadPoolExecutor 的实例依然还在。

这就是我们上面提到的,带有核心线程的 ThreadPoolExecutor,如果没有主动释放或者设置线程超时,如果放在成员变量中,会发生对象实例泄漏。

同样,放在方法体中做局部变量也会有这样的问题。

3. 剖析

为什么会有这样的现象?

线程池无法被回收,是因为线程池的引用被它的内部类 Worker 持有了。而 Worker 和线程一一对应,是对 Thread 的增强,所以本质上就是因为线程没有被释放。

那么任务队列已经空了,并且外界也没有任务过来,线程为什么还没有被释放?

看 ThreadPoolExecutor 的 runWorker方法:

final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                w.lock();
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &&
                      runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                    wt.interrupt();
                try {
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    try {
                        task.run();
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);
                    }
                } finally {
                    task = null;
                    w.completedTasks++;
                    w.unlock();
                }
            }
            completedAbruptly = false;
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }

我们看到要执行线程退出 processWorkerExit 需要这几种情况:

  1. 线程池的状态 >= STOP
  2. getTask 获取到空任务

第一个条件,线程池的状态要达到 STOP,需要调用 shutdown 或者 shutdownNow 方法,我们不满足。

第二个条件,getTask 获取到空任务,继续看 getTask 的代码:

private Runnable getTask() {
        boolean timedOut = false; // Did the last poll() time out?

        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

            // Check if queue empty only if necessary.
            if (rs >= SHUTDOWN && (rs >= STOP || workQueue.isEmpty())) {
                decrementWorkerCount();
                return null;
            }

            int wc = workerCountOf(c);

            // Are workers subject to culling?
            boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;

            if ((wc > maximumPoolSize || (timed && timedOut))
                && (wc > 1 || workQueue.isEmpty())) {
                if (compareAndDecrementWorkerCount(c))
                    return null;
                continue;
            }

            try {
                Runnable r = timed ?
                    workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
                    workQueue.take();
                if (r != null)
                    return r;
                timedOut = true;
            } catch (InterruptedException retry) {
                timedOut = false;
            }
        }
    }

任务队列使用的是阻塞队列 BlockingQueue,该队列提供了两种方法来获取任务:

  1. poll,可以设置超时时间,当超时后会得到一个空任务。
  2. take,阻塞住,直到有任务出现。

从上面的 getTask 方法中我们可以看到:

  1. 当前线程数大于核心线程,会调用 poll,超时后返回空任务。
  2. 当前线程数小于等于核心线程,并且调用了 allowCoreThreadTimeOut 方法允许核心线程超时关闭的情况下,也是调用 poll,超时后返回空任务。
  3. 其他情况,调用 take 阻塞等待。

我们上面使用单个核心线程的线程池,在没有任务的情况下,核心线程正处于 getTask ,调用阻塞队列 BlockingQueue 的 take 方法阻塞等待获取到任务,从而导致线程池包括里面的核心线程迟迟不被关闭并且回收。

4. 小结

像上面那样去设置线程池,可以理解为线程池的局部应用。

不推荐用这样的方式,因为局部线程池能做到的事情,全局线程池也可以做到。而且全局单例的线程池还可以不用考虑关闭线程池的问题,毕竟生命周期和进程一致。

如果业务场景非要这样用的话,并且线程池有核心线程的情况下,要注意做两件事情防止对象泄漏:

  1. 对核心线程设置超时时间。
  2. 主动调用 shutdown 或 shutdownNow 来关闭线程池。

猜你喜欢

转载自blog.csdn.net/Qgwperfect/article/details/82849228