http://www.cnblogs.com/xiaoQLu/archive/2013/05/13/2870588.html

本文原创,转载请注明来自xiaoQLu http://www.cnblogs.com/xiaoQLu/archive/2013/05/13/2870588.html

首先介绍一篇系统学习concurrency包的博文,有兴趣的可以细读下,写得很不错 http://www.blogjava.net/xylz/archive/2010/07/08/325587.html,其中包括缓存线程池的核心队列的介绍 http://www.blogjava.net/xylz/archive/2010/07/30/327582.html 

下面开始今天的正文,线程池的核心类为ThreadPoolExecutor类,线程池基本是围绕它展开的,网上有大堆的学习资料,想快速入门,还是看JDK API,里面有详细的类说明,这里主要介绍其流程以及分析固定线程池(Executors.newFixedThreadPool)和缓存线程池(Executors.newCachedThreadPool)的原理

开始之前,先介绍一下核心线程和最大线程大小的概念:

  核心线程大小(corePoolSize):线程池中存在的线程数,包括空闲线程(就是还在存活时间内,没有干活,等着任务的线程)

  最大池大小(maximumPoolSize):线程池允许存在的最大线程数

ThreadPoolExecutor 将根据 corePoolSize 和 maximumPoolSize 设置的边界自动调整池大小,如果设置的 corePoolSize 和 maximumPoolSize 相同,则创建了固定大小的线程池;如果将 maximumPoolSize 设置为基本的无界值(如Integer.MAX_VALUE),则允许池适应任意数量的并发任务。在大多数情况下,核心和最大池大小仅通过构造函数来设置,不过也可以使用 setCorePoolSize(int) 和 setMaximumPoolSize(int) 进行动态更改。

 

当新任务在方法 execute(java.lang.Runnable) 中提交时,遵循以下几条规则:

规则1.如果运行的线程少于 corePoolSize,则 Executor 始终首选添加新的线程,而不进行排队,即使其他辅助线程是空闲的。

规则2.如果运行的线程多于 corePoolSize 而少于 maximumPoolSize,则首选将任务添加到等待队列,而不添加新的线程。

规则3.如果无法将请求加入队列(队列满),则创建新的线程,除非创建此线程超出 maximumPoolSize,在这种情况下,任务将被拒绝,

 

固定线程池(Executors.newFixedThreadPool)原理

固定线程池是怎么实现线程池固定的呢?看看他的构造函数

public static ExecutorService newFixedThreadPool(int nThreads) {
        return new ThreadPoolExecutor(nThreads, nThreads,
                                      0L, TimeUnit.MILLISECONDS,
                                      new LinkedBlockingQueue<Runnable>());
    }

他的工作线程是固定的,而且最大线程跟核心线程数是一样的,这里就保证了线程数不会超过设定的数值,那他怎么保证任务不被reject掉呢,重点在与他的任务队列,是new LinkedBlockingQueue<Runnable>(),这是一个无界的线程安全队列,是什么意思呢,它可以存放无限个(准确说不是无限的,有个默认值Integer.MAX_VALUE的容量)任务,对照上面的规则2,只有任务队列满时才创建新线程,所以...,你懂的,这也从另外一面保障了线程数不超过设定值

再来看看缓存线程池(Executors.newCachedThreadPool),构造函数

public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue<Runnable>());
    }

神马,他的核心线程是0,初看,确定让人"大吃一斤",问题一,核心线程都没有,怎么工作?先来看看jdk api上对它的介绍:

创建一个可根据需要创建新线程的线程池,但是在以前构造的线程可用时将重用它们。对于执行很多短期异步任务的程序而言,这些线程池通常可提高程序性能。调用 execute 将重用以前构造的线程(如果线程可用)。如果现有线程没有可用的,则创建一个新线程并添加到池中。终止并从缓存中移除那些已有 60 秒钟未被使用的线程。因此,长时间保持空闲的线程池不会使用任何资源。

重点词汇,以前的线程可用时将重用它们,问题二,怎么重用?如果没有可用线程,则创建一个,并移除超过60s未被使用的线程,问题三,怎么保证60s移除未被使用的线程。这两个问题搞清除了,带缓存功能的线程池你就搞清楚了

首先看问题一:

既然核心线程为0,那么运行线程肯定>=核心线程了,所以规则一不适用;规则二的应用就要要情况了,(1)第一个任务是肯定进不了队列的,因为缓存线程池的队列是SynchronousQueue,这个很有意思(不懂的去最开始的链接大致看一下),因为他的内部没有任何容量,只有当你正好同时使用一对操作(插入-移除)时,元素才存在,简单地说就是,当你进行offer操作时,如果正好有另外一个线程在执行插入操作时,那么恭喜你中奖了,可以拿到元素,其他时候,你都是拿不到的。所以对于第一个任务,规则2是不适用的,这时就规则3起作用了,调用addIfUnderMaximumPoolSize方法添加一个线程工作,这个线程工作完成了,不是立即就退出的,它要接着取任务,取不到任务,就等待设定的超时时间后退出,同时从缓存线程池中移除此线程。(2)其他任务大部分情况和第一个任务一样,是进不去,在有大量并发的情况下,是可能拿到任务的,这时候又要分两种情况,如果线程池中没有可用线程,则新建线程执行,如果有可用进程,刚直接在可用线程中执行任务

问题二:工作线程的重用其实是在内部类work中的run方法,如下,可以看到work类-工作线程是在不断的从队列中取任务的,想详细了解怎么取任务的可以细看下getTask方法,这样一个循环就保证了工作线程的重用,即线程执行完一个任务后,可以执行下一个,那是不是会造成死循环呢?请看问题三

/**
         * Main run loop
         */
        public void run() {
            try {
                Runnable task = firstTask;
                firstTask = null;
                while (task != null || (task = getTask()) != null) {
                    runTask(task);
                    task = null;
                }
            } finally {
                workerDone(this);
            }
        }

问题三:移除60s未使用的线程,就是在getTask方法中,下面这句是getTask等待取任务的过程,可以看到在keepAliveTime的时间内,如果没有任务进来(通过execute提前),那么这个线程会在work类的run方法中的finally中,把自己从线程池中移除,并把task置为空。ok,成功解决问题三。

......
    r = workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS);
......

回顾整个线程池的工作原理,其实不同的线程池从构造方法上来看,就是核心线程数和最大线程数以及工作队列的不同,其中队列的应用堪称精妙,使用不同的组合就可以达到不同的效果,整个线程池设计的非常巧妙,一个类实现几种不同线程池的工作,经典。

至此,线程池工作原理告一段落,讲得不清楚的地方欢迎留言讨论。

附几个讲原理比较不错的网址:

Java多线程之线程池深入分析-推荐 http://blog.csdn.net/a511596982/article/details/8299108 http://blog.csdn.net/a511596982/article/details/8299108,写得很详细,值得细看

源码分析,整个ThreadPoolExecutor的java文件分析,可以作为分析的工具 http://www.cnblogs.com/rilley/archive/2012/02/07/2341767.html

线程池分析 http://xtu-xiaoxin.iteye.com/blog/647744 这个讲的比较笼统,适合想快速了解原理的人