本文总结一下线程池是怎么回事
第一部分:线程池类的结构
线程池存在于Java的并发包J.U.C中,线程池可以根据项目灵活控制并发的数目,避免频繁的创建和销毁线程,达到线程对象的重用。
下面是线程池的类图:
1、 接口Executor
接口Executor中,只有一个方法,为execute()
2、 接口ExecutorService,继承自Executor
几个重要的方法:
(1) 关闭线程池的方法,有两种
一个ExecutorService(J.U.C)可以关闭,这将导致它拒绝新的任务。 ExecutorService的两种关闭线程池的方式,shutdown和shutdownNow方法:
① shutdown():拒收新的任务,立马关闭正在执行的任务,可能会引起报错,需要异常捕获
② shutdownNow():拒收新的任务,等待任务执行完毕,要确保任务里不会有永久等待阻塞的逻辑,否则会导致线程关闭不了
③ 不是马上关闭,要想等待线程池关闭,还需要调用waitFermination来阻塞等待
④ 还有一些业务场景下,需要知道线程池中的任务是否全部执行完成,当我们关闭线程池之后,可以用isTerminated来判断所有的线程是否执行完成,千万不要用isShutdown, 它只是返回你是否调用过shutdown的结果
(2) submit()方法
方法submit延伸的方法Executor.execute(Runnable)通过创建并返回一个Future可用于取消执行和/或等待完成。submit()与execute()的一个区别是submit()有返回值,并且能够处理 异常
3、 Executors(J.U.C),提供了6个静态方法,分别创建6种不同的线程池,六大静态方法 内部都是直接或间接调用ThreadPoolExecutor类的构造方法创建线程池对象,这六个静态方法 本身是没有技术含量的。
下面介绍常用的四种:
(1)FixedThreadPool
FixedThreadPool的特点:固定池子中线程的个数。使用静态方法newFixedThreadPool()创建线程池的时候指定线程池个数。
(2)CachedThreadPool(弹性缓存线程池)
CachedThreadPool的特点:用newCachedThreadPool()方法创建该线程池对象, 创建之初里面一个线程都没有,当execute方法或submit方法向线程池提交任务时, 会自动新建线程;如果线程池中有空余线程,则不会新建;这种线程池一般最多情况可 以容纳几万个线程,里面的线程空余60s会被回收。
(3)SingleThreadPool(单线程线程池)
SingleThreadPool的特点:池中只有一个线程,如果扔5个任务进来,那么有4个任务将排队;作用是保证任务的顺序执行。
(4)ScheduledThreadpool(定时器线程池)
注意:要用ScheduledExecutorService去创建ScheduledThreadpool,如果用Executor去引用,就只能调用Executor接口中定义的方法;如果用ExecutorService接口去引用,就只能调用ExecutorService接口中定义的方法,无法使用ScheduledExecutorService接口中新增的方法,那么也就失去了这种线程池的意义
第二部分:线程池的使用
第一种方式,构建一个线程池
ExecutorService threadPool = Executors.newFixedThreadPool(10);
第二种方式,使用ThreadPoolExecutor构建一个线程池
import java.util.concurrent.ArrayBlockingQueue;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.ThreadPoolExecutor;
import java.util.concurrent.TimeUnit;
public class test {
public static void main(String args[]) {
ExecutorService executorService = new ThreadPoolExecutor(5,10,
10,TimeUnit.SECONDS,new ArrayBlockingQueue<Runnable>(5));
executorService.execute(new Runnable() {
@Override
public void run() {
System.out.println("开始执行线程池中的任务");
}
});
}
}
如果只是简单的想要改变线程名称的前缀的话可以自定义ThreadFactory来实现,在Executors.new…中有一个ThreadFactory的参数,如果没有指定则用的是DefaultThreadFactory。
第三种方式,使用工具来创建线程池,Apache的guava中ThreadFactoryBuilder()来创建线程池,不仅可以避免OOM问题,还可以自定义线程名称,方便出错时溯源
第三部分:线程池的流程梳理
1、线程池的参数
(1) corePoolSize:核心线程数的大小
(2) maximumPoolSize:最大线程数的大小
(3) keepAliveTime:线程的空闲时间
(4) TimeUnit:空闲时间的单位
(5) workQueue:阻塞队列
(6) threadFactory:线程工厂
(7) Handler:拒绝策略
参数的详细说明:
(1) corePoolSize:池子里的线程数的大小,设置allowCoreThreadTimeOut(true)使核心线程数内的线程也可以被回收
(2) maximumPoolSize:当池子里的线程数达到核心线程数的大小,队列也满了,可以继续创建的线程,直到线程数达到maximumPoolSize
(3) keepAliveTime:线程的空闲时间,是跟核心线程数和最大线程数之间的线程相关,这部分线程,当到达规定的空闲时间还没有获取到任务,则会被回收
(4) TimeUnit:空闲时间的单位
(5) workQueue:默认支持4种阻塞队列
①ArrayBlockingQueue,基于数组的有界阻塞队列,按FIFO排序。新任务进来后,会放到该队列的队尾,有界的数组可以防止资源耗尽问题。
②LinkedBlockingQuene,基于链表的无界阻塞队列(其实最大容量为Interger.MAX),按照FIFO排序。由于该队列的近似无界性,当线程池中线程数量达到corePoolSize 后,再有新任务进来,会一直存入该队列,而不会去创建新线程直到maxPoolSize,因此使用该工作队列时,参数maxPoolSize其实是不起作用的。
③SynchronousQuene,一个不缓存任务的阻塞队列,生产者放入一个任务必须等到消费者取出这个任务。也就是说新任务进来时,不会缓存,而是直接被调度执行该任务, 如果没有可用线程,则创建新线程,如果线程数量达到maxPoolSize,则执行拒绝策略。
④PriorityBlockingQueue,具有优先级的无界阻塞队列,优先级通过参数Comparator实现。
(6) threadFactory:线程工厂,用来创建一个新线程时使用的工厂,可以用来设定线程名,是否为daemon线程等
(7) Handler:拒绝策略
①CallerRunsPolicy(直接拒绝任务),该策略下,在调用者线程中直接执行被拒绝任务的run方法,除非线程池已经shutdown,则直接抛弃任务。
②AbortPolicy(直接丢弃任务,并抛异常),该策略下,直接丢弃任务,并抛出RejectedExecutionException异常。
③DiscardPolicy(直接丢弃任务,什么都不做),该策略下,直接丢弃任务,什么都不做。
④DiscardOldestPolicy(尝试添加新任务),该策略下,抛弃进入队列最早的那个任务,然后尝试把这次拒绝的任务放入队列
2、线程池的运行过程
(1) 刚开始运行时,线程池是空的
(2) 一个任务进来,检查池中的线程数量,是否达到corePoolSize,如果没有达到,则创建线程,执行任务
(3) 任务执行完成之后,线程不会销毁,而是阻塞的等待下一个任务
(4) 又进来一个任务,不是直接使用阻塞的线程,而是检查线程池中的线程数大小,是否达到corePoolSize,如果没有达到,则继续创建新的线程,来执行新的任务,如此往复, 直到线程池中的线程数达到corePoolSize,此时停止创建新的线程
(5) 此时,又来新的任务,会选择线程池中阻塞等待的线程来执行任务,有一个任务进来,唤醒一个线程来执行这个任务,处理完之后,再次阻塞,尝试在workQueue上获取下一 个任务,如果线程池中没有可唤醒的线程,则任务进入workQueue,排队等待
(6) 如果队列是无界队列,比如LinkedBlockingQueue,默认最大容量为Integer.MAX,接近于无界,可用无限制的接收任务,如果队列是有界队列,比如ArrayBlockingQueue,可限定队列大小,当线程池中的线程来不及处理,然后,所有的任务都进入队列,队列的任务数也达到限定大小,此时,再来新的任务,就会入队失败,然后,就会再次尝试在线程池里创建线程,直到线程数达到maximumPoolSize,停止创建线程
(7)此时,队列满了,新的任务无法入队,创建的线程数也达到了maximumPoolSize,无法再创建新的线程,此时,就会reject掉,使用拒绝策略RejectedExecutionHandler,不让继续提交任务,默认的是AbortPolicy策略,拒绝,并抛出异常
(8) 超出corePoolSize数创建的那部分线程,是跟空闲时间keepAliveTime相关的,如果超过keepAliveTime时间还获取不到任务,线程会被销毁,自动释放掉
第四部分:线程池的应用场景
1、newSingleThreadExecutor:一个单线程的线程池,可以用于需要保证顺序执行的场景,并且只有一个线程在执行。
2、newFixedThreadPool:一个固定大小的线程池,可以用于已知并发压力的情况下,对线程数做限制。
3、newCachedThreadPool:一个可以无限扩大的线程池,比较适合处理执行时间比较小的任务。
4、newScheduledThreadPool:可以延时启动,定时启动的线程池,适用于需要多个后台线程执行周期任务的场景。
5、newWorkStealingPool:一个拥有多个任务队列的线程池,可以减少连接数,创建当前可用cpu数量的线程来并行执行。
线程池的实际业务场景:线程池适合单系统的大量的异步任务处理,比如发送短信、保存日志。
第五部分:线程池相关的面试题
1、为什么使用线程池,线程池有什么作用?
线程池,就是一个池子,存放指定数量的线程来执行任务,处理完任务的线程不进行回收,而是阻塞等待下一个任务,避免了频繁的创建和销毁线程,达到了线程的重用。
2、如何创建一个线程池?
最常用的,使用ThreadPoolExecutor实现类来创建线程池
3、如何关闭一个线程池?
ExecutorService提供了两种方法来关闭线程池,shutdown()和shutdownNow()
(1) shutdown:拒收新的任务,立马关闭正在执行的任务,可能会引起报错,需要异常捕获
(2) shutdownNow:拒收新的任务,等待任务执行完毕,要确保任务里不会有永久等待阻塞的逻辑,否则会导致线程关闭不了
不是马上关闭,要想等待线程池关闭,还需要调用waitFermination来阻塞等待
还有一些业务场景下,需要知道线程池中的任务是否全部执行完成,当我们关闭线程池之后,可以用isTerminated来判断所有的线程是否执行完成,千万不要用isShutdown,它只 是返回你是否调用过shutdown的结果
4、submit()和execute()方法的区别?
execute()方法在Executor()接口中,且是接口中唯一的方法
submit()方法在ExecutorService中,ExecutorService接口继承Executor 接口
execute()方法,开启线程执行池中的任务
submit()方法,也可以做到execute()的作用,它还可以返回执行结果,它的 功能是提交指定的任务去执行并且返回Future对象(即执行的结果)
submit()和execute()的区别:
1) 接收的参数不一样
2) submit()方法有返回值Future,而execute()方法没有返回值
3) submit()方法方便处理Exception异常,意思就是,你在task里会抛出checked或者unchecked exception, 而又希望外面的调用者能够感知这些exception并作出及时的处理,用 submit,通过捕获Future.get抛出的异常
5、为什么不建议使用Executors创建线程,而使用ThreadPoolExecutor实现类来创建线程?
Executors中FixedThreadPool使用的是LinkedBlockingQueue队列,近乎于无界,队列大小默认为Integer.MAX_VALUE,几乎可以无限制的放任务到队列中,线程池中数量是固定的,当线程池中线程数量达到corePoolSize,不会再创建新的线程,所有任务都会入队到workQueue中,线程从workQueue中获取任务,但这个队列几乎永远不会满,只要队列不满,就不会再去创建新的线程,就跟maximumPoolSize和keepAliveTime没有关系,此时,如果线程池中的线程处理任务的时间特别长,导致无法处理新的任务,队列中的任务就会不断的积压,这个过程,会导致机器的内存使用不停的飙升,极端情况下会导致JVM OOM,系统就挂了。
总结:Executors中FixedThreadPool指定使用无界队列LinkedBlockingQueue会导致内存溢出,所以,最好使用ThreadPoolExecutor自定义线程池
换一种问法:线程池中,无界队列导致的内存飙升问题,同上
6、线程池如何调优
(1)首先,根据不同的需求选择线程池,如果需要单线程顺序执行,使用SingleThreadExecutor,如果已知并发压力,使用FixedThreadPool,固定线程数的大小,执行时间小的任务,可以使用CachedThreadPool,创建可缓存的线程池,可以无限扩大线程池,可以灵活回收空闲线程,最多可容纳几万个线程,线程空余60s会被回收,需要后台执行周期任务的,可以使用ScheduledThreadPool,可以延时启动和定时启动线程池,
(2)如何确认线程池的最大线程数目,分CPU密集型和IO密集型,如果是CPU密集型或计算密集型,因为CPU的利用率高,核心线程数可设置为n(核数)+1,如果是IO密集型,CPU利用率不高,可多给几个线程数,来进行工作,核心线程数可设置为2n(核数)
如果觉得本文对你有帮助,可以转发关注支持一下