Java并发编程(十七)------Java中的线程池

本文转载自：https://blog.csdn.net/u010425776/article/details/56673564

1. 线程池的作用

减少资源的开销
减少了每次创建线程、销毁线程的开销。
提高响应速度
每次请求到来时，由于线程的创建已经完成，故可以直接执行任务，因此提高了响应速度。
提高线程的可管理性
线程是一种稀缺资源，若不加以限制，不仅会占用大量资源，而且会影响系统的稳定性。
因此，线程池可以对线程的创建与停止、线程数量等等因素加以控制，使得线程在一种可控的范围内运行，不仅能保证系统稳定运行，而且方便性能调优。

2. 线程池的实现原理

线程池一般由两种角色构成：多个工作线程和一个阻塞队列。

工作线程
工作线程是一组已经处在运行中的线程，它们不断地向阻塞队列中领取任务执行。
阻塞队列
阻塞队列用于存储工作线程来不及处理的任务。当工作线程都在执行任务时，到来的新任务就只能暂时在阻塞队列中存储。

3. ThreadPoolExecutor的使用

3.1 创建线程池

通过如下代码即可创建一个线程池：

new ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime, timeUnit, runnableTaskQueue, handler);

corePoolSize：基本线程数量
它表示你希望线程池达到的一个值。线程池会尽量把实际线程数量保持在这个值上下。
maximumPoolSize：最大线程数量
这是线程数量的上界。
如果实际线程数量达到这个值：
1. 阻塞队列未满：任务存入阻塞队列等待执行
2. 阻塞队列已满：调用饱和策略
keepAliveTime：空闲线程的存活时间
当实际线程数量超过corePoolSize时，若线程空闲的时间超过该值，就会被停止。
PS：当任务很多，且任务执行时间很短的情况下，可以将该值调大，提高线程利用率。
timeUnit：keepAliveTime的单位
runnableTaskQueue：任务队列，这是一个存放任务的阻塞队列，可以有如下几种选择：
1. ArrayBlockingQueue
  它是一个由数组实现的阻塞队列，FIFO。
2. LinkedBlockingQueue
  它是一个由链表实现的阻塞队列，FIFO。
  吞吐量通常要高于ArrayBlockingQueue。
  fixedThreadPool使用的阻塞队列就是它。
  它是一个无界队列。
3. SynchronousQueue
  它是一个没有存储空间的阻塞队列，任务提交给它之后必须要交给一条工作线程处理；如果当前没有空闲的工作线程，则立即创建一条新的工作线程。
  cachedThreadPool用的阻塞队列就是它。
  它是一个无界队列。
4. PriorityBlockingQueue
  它是一个优先权阻塞队列。
handler：饱和策略
当实际线程数达到maximumPoolSize，并且阻塞队列已满时，就会调用饱和策略。
JDK1.5由四种饱和策略：
1. AbortPolicy
  默认，直接抛异常。
2. CallerRunsPolicy
  只用调用者所在的线程执行任务。
3. DiscardOldestPolicy
  丢弃任务队列中最久的任务。
4. DiscardPolicy
  丢弃当前任务。

3.2 提交任务

可以向ThreadPoolExecutor提交两种任务：Callable和Runnable。

Callable
该类任务有返回结果，可以抛出异常。
通过submit函数提交，返回Future对象。
可通过get获取执行结果。
Runnable
该类任务只执行，无法获取返回结果，并在执行过程中无法抛异常。
通过execute提交。

3.3 关闭线程池

关闭线程池有两种方式：shutdown和shutdownNow，关闭时，会遍历所有的线程，调用它们的interrupt函数中断线程。但这两种方式对于正在执行的线程处理方式不同。

shutdown()
仅停止阻塞队列中等待的线程，那些正在执行的线程就会让他们执行结束。
shutdownNow()
不仅会停止阻塞队列中的线程，而且会停止正在执行的线程。

3.4 ThreadPoolExecutor运行机制

当提交一个新任务到线程池时，线程池的处理流程如下。

线程池判断核心线程池里的线程是否都在执行任务。如果不是，则创建一个新的工作线程来执行任务。如果核心线程池里的线程都在执行任务，则进入下个流程。
线程池判断工作队列是否已经满。如果工作队列没有满，则将新提交的任务存储在这个工作队列里。如果工作队列满了，则进入下个流程。
线程池判断线程池的线程是否都处于工作状态。如果没有，则创建一个新的工作线程来执行任务。如果已经满了，则交给饱和策略来处理这个任务。

ThreadPoolExecutor执行execute()方法的示意图：

当有请求到来时：

若当前实际线程数量少于 corePoolSize，即使有空闲线程，也会创建一个新的工作线程；
若当前实际线程数量处于corePoolSize和maximumPoolSize之间，并且阻塞队列没满，则任务将被放入阻塞队列中等待执行；
若当前实际线程数量小于 maximumPoolSize，但阻塞队列已满，则直接创建新线程处理任务；
若当前实际线程数量已经达到maximumPoolSize，并且阻塞队列已满，则使用饱和策略调用RejectedExecutionHandler 的rejectedExecution()方法。

线程池中的线程执行任务分两种情况：

在execute()方法中创建一个线程时，会让这个线程执行当前任务。
这个线程执行完上图中1的任务后，会反复从BlockingQueue获取任务来执行。

ThreadPoolExecutor中线程执行任务的如图所示：

4. 设置合理的线程池大小

任务一般可分为：CPU密集型、IO密集型、混合型，对于不同类型的任务需要分配不同大小的线程池。

CPU密集型任务
尽量使用较小的线程池，一般为CPU核心数+1。
因为CPU密集型任务使得CPU使用率很高，若开过多的线程数，只能增加上下文切换的次数，因此会带来额外的开销。
IO密集型任务
可以使用稍大的线程池，一般为2*CPU核心数。
IO密集型任务CPU使用率并不高，因此可以让CPU在等待IO的时候去处理别的任务，充分利用CPU时间。
混合型任务
可以将任务分成IO密集型和CPU密集型任务，然后分别用不同的线程池去处理。
只要分完之后两个任务的执行时间相差不大，那么就会比串行执行来的高效。
因为如果划分之后两个任务执行时间相差甚远，那么先执行完的任务就要等后执行完的任务，最终的时间仍然取决于后执行完的任务，而且还要加上任务拆分与合并的开销，得不偿失。