Java并发编程(十七)------Java中的线程池

本文转载自:https://blog.csdn.net/u010425776/article/details/56673564

1. 线程池的作用

  1. 减少资源的开销 
    减少了每次创建线程、销毁线程的开销。

  2. 提高响应速度 
    每次请求到来时,由于线程的创建已经完成,故可以直接执行任务,因此提高了响应速度。

  3. 提高线程的可管理性 
    线程是一种稀缺资源,若不加以限制,不仅会占用大量资源,而且会影响系统的稳定性。 
    因此,线程池可以对线程的创建与停止、线程数量等等因素加以控制,使得线程在一种可控的范围内运行,不仅能保证系统稳定运行,而且方便性能调优。

2. 线程池的实现原理

线程池一般由两种角色构成:多个工作线程 和 一个阻塞队列。

  • 工作线程 
    工作线程是一组已经处在运行中的线程,它们不断地向阻塞队列中领取任务执行。

  • 阻塞队列 
    阻塞队列用于存储工作线程来不及处理的任务。当工作线程都在执行任务时,到来的新任务就只能暂时在阻塞队列中存储。

3. ThreadPoolExecutor的使用

3.1 创建线程池

通过如下代码即可创建一个线程池:

new ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime, timeUnit, runnableTaskQueue, handler);
  • corePoolSize:基本线程数量 
    它表示你希望线程池达到的一个值。线程池会尽量把实际线程数量保持在这个值上下。

  • maximumPoolSize:最大线程数量 
    这是线程数量的上界。 
    如果实际线程数量达到这个值:

    1. 阻塞队列未满:任务存入阻塞队列等待执行
    2. 阻塞队列已满:调用饱和策略
  • keepAliveTime:空闲线程的存活时间 
    当实际线程数量超过corePoolSize时,若线程空闲的时间超过该值,就会被停止。 
    PS:当任务很多,且任务执行时间很短的情况下,可以将该值调大,提高线程利用率。

  • timeUnit:keepAliveTime的单位

  • runnableTaskQueue:任务队列 ,这是一个存放任务的阻塞队列,可以有如下几种选择:

    1. ArrayBlockingQueue 
      它是一个由数组实现的阻塞队列,FIFO。
    2. LinkedBlockingQueue 
      它是一个由链表实现的阻塞队列,FIFO。 
      吞吐量通常要高于ArrayBlockingQueue。 
      fixedThreadPool使用的阻塞队列就是它。 
      它是一个无界队列。
    3. SynchronousQueue 
      它是一个没有存储空间的阻塞队列,任务提交给它之后必须要交给一条工作线程处理;如果当前没有空闲的工作线程,则立即创建一条新的工作线程。 
      cachedThreadPool用的阻塞队列就是它。 
      它是一个无界队列。
    4. PriorityBlockingQueue 
      它是一个优先权阻塞队列。 
  • handler:饱和策略 
    当实际线程数达到maximumPoolSize,并且阻塞队列已满时,就会调用饱和策略。 
    JDK1.5由四种饱和策略: 
    1. AbortPolicy 
      默认,直接抛异常。
    2. CallerRunsPolicy 
      只用调用者所在的线程执行任务。
    3. DiscardOldestPolicy 
      丢弃任务队列中最久的任务。
    4. DiscardPolicy 
      丢弃当前任务。

3.2 提交任务

可以向ThreadPoolExecutor提交两种任务:Callable和Runnable。

  1. Callable 
    该类任务有返回结果,可以抛出异常。 
    通过submit函数提交,返回Future对象。 
    可通过get获取执行结果。

  2. Runnable 
    该类任务只执行,无法获取返回结果,并在执行过程中无法抛异常。 
    通过execute提交。

3.3 关闭线程池

关闭线程池有两种方式:shutdown和shutdownNow,关闭时,会遍历所有的线程,调用它们的interrupt函数中断线程。但这两种方式对于正在执行的线程处理方式不同。

  1. shutdown() 
    仅停止阻塞队列中等待的线程,那些正在执行的线程就会让他们执行结束。
  2. shutdownNow() 
    不仅会停止阻塞队列中的线程,而且会停止正在执行的线程。

3.4 ThreadPoolExecutor运行机制

当提交一个新任务到线程池时,线程池的处理流程如下。

  1. 线程池判断核心线程池里的线程是否都在执行任务。如果不是,则创建一个新的工作线程来执行任务。如果核心线程池里的线程都在执行任务,则进入下个流程。
  2. 线程池判断工作队列是否已经满。如果工作队列没有满,则将新提交的任务存储在这个工作队列里。如果工作队列满了,则进入下个流程。
  3. 线程池判断线程池的线程是否都处于工作状态。如果没有,则创建一个新的工作线程来执行任务。如果已经满了,则交给饱和策略来处理这个任务。

ThreadPoolExecutor执行execute()方法的示意图:

当有请求到来时:

  1. 若当前实际线程数量 少于 corePoolSize,即使有空闲线程,也会创建一个新的工作线程;
  2. 若当前实际线程数量处于corePoolSize和maximumPoolSize之间,并且阻塞队列没满,则任务将被放入阻塞队列中等待执行;
  3. 若当前实际线程数量 小于 maximumPoolSize,但阻塞队列已满,则直接创建新线程处理任务;
  4. 若当前实际线程数量已经达到maximumPoolSize,并且阻塞队列已满,则使用饱和策略调用RejectedExecutionHandler 的rejectedExecution()方法。

线程池中的线程执行任务分两种情况:

  1. 在execute()方法中创建一个线程时,会让这个线程执行当前任务。
  2. 这个线程执行完上图中1的任务后,会反复从BlockingQueue获取任务来执行。

ThreadPoolExecutor中线程执行任务的如图所示:

4. 设置合理的线程池大小

任务一般可分为:CPU密集型、IO密集型、混合型,对于不同类型的任务需要分配不同大小的线程池。

  • CPU密集型任务 
    尽量使用较小的线程池,一般为CPU核心数+1。 
    因为CPU密集型任务使得CPU使用率很高,若开过多的线程数,只能增加上下文切换的次数,因此会带来额外的开销。

  • IO密集型任务 
    可以使用稍大的线程池,一般为2*CPU核心数。 
    IO密集型任务CPU使用率并不高,因此可以让CPU在等待IO的时候去处理别的任务,充分利用CPU时间。

  • 混合型任务 
    可以将任务分成IO密集型和CPU密集型任务,然后分别用不同的线程池去处理。 
    只要分完之后两个任务的执行时间相差不大,那么就会比串行执行来的高效。 
    因为如果划分之后两个任务执行时间相差甚远,那么先执行完的任务就要等后执行完的任务,最终的时间仍然取决于后执行完的任务,而且还要加上任务拆分与合并的开销,得不偿失。

猜你喜欢

转载自blog.csdn.net/DjokerMax/article/details/81325785