從根兒上認(rèn)識線程池-魔扣目錄

前言

大家好，我是jack xu，本篇是并發(fā)編程的第二篇，今天跟大家聊一聊線程池的那點(diǎn)事。本篇文章有點(diǎn)長，小伙們靜下心、耐下心來把他看完。。

為什么要使用線程池

1）降低創(chuàng)建線程和銷毀線程的性能開銷

2）提高響應(yīng)速度，當(dāng)有新任務(wù)需要執(zhí)行是不需要等待線程創(chuàng)建就可以立馬執(zhí)行

3）合理的設(shè)置線程池大小可以避免因?yàn)榫€程數(shù)超過硬件資源瓶頸帶來的問題

我們來看阿里巴巴的代碼規(guī)范，在項(xiàng)目中創(chuàng)建線程必須要使用線程池創(chuàng)建，原因就是我說的以上三點(diǎn)

線程池的使用

首先我們來看下UML類圖

Executor：可以看到最頂層是 Executor 的接口。這個接口很簡單，只有一個 execute 方法。此接口的目的是為了把任務(wù)提交和任務(wù)執(zhí)行解耦。
ExecutorService：這還是一個接口，繼承自 Executor，它擴(kuò)展了 Executor 接口，定義了更多線程池相關(guān)的操作。
AbstractExecutorService：提供了 ExecutorService 的部分默認(rèn)實(shí)現(xiàn)。
ThreadPoolExecutor：實(shí)際上我們使用的線程池的實(shí)現(xiàn)是 ThreadPoolExecutor。它實(shí)現(xiàn)了線程池工作的完整機(jī)制。也是我們接下來分析的重點(diǎn)對象。
ForkJoinPool：和ThreadPoolExecutor都繼承自AbstractExecutorService，適合用于分而治之，遞歸計算的算法
ScheduledExecutorService：這個接口擴(kuò)展了ExecutorService，定義個延遲執(zhí)行和周期性執(zhí)行任務(wù)的方法。
ScheduledThreadPoolExecutor：此接口則是在繼承 ThreadPoolExecutor 的基礎(chǔ)上實(shí)現(xiàn) ScheduledExecutorService 接口，提供定時和周期執(zhí)行任務(wù)的特性。

搞清楚上面的結(jié)構(gòu)很重要，Executors是一個工具類，然后看創(chuàng)建線程的兩種方式，第一種是通過Executors提供的工廠方法來實(shí)現(xiàn)，有下面四種方式

        Executor executor1 = Executors.newFixedThreadPool(10);
        Executor executor2 = Executors.newSingleThreadExecutor();
        Executor executor3 = Executors.newCachedThreadPool();
        Executor executor4 = Executors.newScheduledThreadPool(10);
復(fù)制代碼

第二種是通過構(gòu)造方法來實(shí)現(xiàn)

        ExecutorService executor5 = new ThreadPoolExecutor(1,
                1,
                0L,
                TimeUnit.MILLISECONDS,
                new ArrayBlockingQueue<>(2), Executors.defaultThreadFactory(),
                new ThreadPoolExecutor.AbortPolicy());
復(fù)制代碼

其實(shí)查看第一種方式創(chuàng)建的源碼就會發(fā)現(xiàn)：

    public static ExecutorService newCachedThreadPool() {
        return new ThreadPoolExecutor(0, Integer.MAX_VALUE,
                                      60L, TimeUnit.SECONDS,
                                      new SynchronousQueue());
    }
復(fù)制代碼

根本上還是通過調(diào)用ThreadPoolExecutor的構(gòu)造方法，創(chuàng)建時傳入不同參數(shù)，所以本質(zhì)上還是只有一種創(chuàng)建線程池的方式，就是用構(gòu)造方法，這里我不想講用Executors的工廠方法具體幫我們創(chuàng)建了怎樣的線程池，讓我們再來看一條阿里巴巴規(guī)范。

看到這里大家都明白了吧，正是因?yàn)榉庋b性太強(qiáng)了，反而小伙們會不知道怎么用，亂用，濫用，有可能會導(dǎo)致OOM，除非你對創(chuàng)建的這四個線程池了如指掌，所以我介紹了也是白介紹，因?yàn)榫筒辉谟茫酉聛砦覀冎攸c(diǎn)看下ThreadPoolExecutor構(gòu)造方法里各個參數(shù)的含義，構(gòu)造方法有很多個，我選了一個最完整的。

public ThreadPoolExecutor(int corePoolSize, //核心線程數(shù)量
                          int maximumPoolSize, //最大線程數(shù)
                          long keepAliveTime, //超時時間,超出核心線程數(shù)量以外的線程空余存活時間
                          TimeUnit unit, //存活時間單位
                          BlockingQueue<Runnable> workQueue, //保存執(zhí)行任務(wù)的隊(duì)列
                          ThreadFactory threadFactory,//創(chuàng)建新線程使用的工廠
                          RejectedExecutionHandler handler //當(dāng)任務(wù)無法執(zhí)行的時候的處理方式)
復(fù)制代碼

corePoolSize：即線程池的核心線程數(shù)量，其實(shí)也是最小線程數(shù)量。不設(shè)置allowCoreThreadTimeOut 的情況下，核心線程數(shù)量范圍內(nèi)的線程一直存活。線程不會自行銷毀，而是以掛起的狀態(tài)返回到線程池，直到應(yīng)用程序再次向線程池發(fā)出請求時，線程池里掛起的線程就會再度激活執(zhí)行任務(wù)。
maximumPoolSize：即線程池的最大線程數(shù)量
keepAliveTime和unit：超出核心線程數(shù)后的存活時間和單位
workQueue：是一個阻塞的 queue，用來保存線程池要執(zhí)行的所有任務(wù)。通常可以取下面三種類型：

1）ArrayBlockingQueue：基于數(shù)組的先進(jìn)先出隊(duì)列，此隊(duì)列創(chuàng)建時必須指定大小；  
2）LinkedBlockingQueue：基于鏈表的先進(jìn)先出隊(duì)列，如果創(chuàng)建時沒有指定此隊(duì)列大小，則默認(rèn)為Integer.MAX_VALUE;
3）SynchronousQueue：這個隊(duì)列比較特殊，它不會保存提交的任務(wù)，而是將直接新建一個線程來執(zhí)行新來的任務(wù)。
復(fù)制代碼

ThreadFactory：我們一般用Executors.defaultThreadFactory()默認(rèn)工廠，為什么要用工廠呢，其實(shí)就是規(guī)范了生成的Thread。避免調(diào)用new Thread創(chuàng)建，導(dǎo)致創(chuàng)建出來的Thread可能存在差異
handler：當(dāng)隊(duì)列和最大線程池都滿了之后的飽和策略。

1、AbortPolicy：直接拋出異常，默認(rèn)策略；
2、CallerRunsPolicy：用調(diào)用者所在的線程來執(zhí)行任務(wù)；
3、DiscardOldestPolicy：丟棄阻塞隊(duì)列中靠最前的任務(wù)，并執(zhí)行當(dāng)前任務(wù)；
4、DiscardPolicy：直接丟棄任務(wù)；
當(dāng)然也可以根據(jù)應(yīng)用場景實(shí)現(xiàn) RejectedExecutionHandler 接口，自定義飽和策略，如記錄
日志或持久化存儲不能處理的任務(wù)
復(fù)制代碼

創(chuàng)建完線程池后使用也很簡單，帶返回值和不帶返回值，傳入對應(yīng)傳入Runnable或者Callable接口的實(shí)現(xiàn)

        //無返回值
        executor5.execute(() -> System.out.println("jack xushuaige"));
        //帶返回值
        String message = executor5.submit(() -> { return "jack xushuaige"; }).get();
復(fù)制代碼

源碼分析

execute方法

基于源碼入口進(jìn)行分析，先看execute方法

    public void execute(Runnable command) {
        if (command == null)
            throw new NullPointerException();
        int c = ctl.get();
        if (workerCountOf(c) < corePoolSize) {
            if (addWorker(command, true))
                return;
            c = ctl.get();
        }
        if (isRunning(c) && workQueue.offer(command)) {
            int recheck = ctl.get();
            if (! isRunning(recheck) && remove(command))
                reject(command);
            else if (workerCountOf(recheck) == 0)
                addWorker(null, false);
        }
        else if (!addWorker(command, false))
            reject(command);
    }
復(fù)制代碼

源代碼中有一段關(guān)鍵的注釋我沒有貼進(jìn)來，下面我先把這段關(guān)鍵的注釋翻譯講解下：

分三步做處理：

1、如果運(yùn)行的線程數(shù)量小于 corePoolSize，那么嘗試創(chuàng)建新的線程，并把傳入的 command 作為它的第一個 task 來執(zhí)行。調(diào)用 addWorker 會自動檢查 runState 和 workCount，以此來防止在不應(yīng)該添加線程時添加線程的錯誤警告；

2、即使 task 可以被成功加入隊(duì)列，我們?nèi)耘f需要再次確認(rèn)我們是否應(yīng)該添加 thread（因?yàn)樽詈笠淮螜z查之后可能有線程已經(jīng)死掉了）還是線程池在進(jìn)入此方法后已經(jīng)停掉了。所以我們會再次檢查狀態(tài)，如果有必要的話，可以回滾隊(duì)列。或者當(dāng)沒有線程時，開啟新的 thread；

3、如果無法將 task 加入 queue，那么可以嘗試添加新的 thread。如果添加失敗，這是因?yàn)榫€程池被關(guān)閉或者已經(jīng)飽和了，所以拒絕這個 task。

如果你看完以后還是一臉懵逼，那沒事，我把這個流程圖畫下來，你品，你細(xì)品，好好理解一下

然后介紹一下源碼中ctl是干什么的，點(diǎn)進(jìn)去查看源碼

我們發(fā)現(xiàn)它是一個原子類，主要作用是用來保存線程數(shù)量和線程池的狀態(tài)，他用到了位運(yùn)算，一個int數(shù)值是32個 bit 位，這里采用高 3 位來保存運(yùn)行狀態(tài)，低 29 位來保存線程數(shù)量。

我們來計算一下ctlOf(RUNNING, 0)方法，其中 RUNNING =-1 << COUNT_BITS ； -1 左移 29 位，-1 的二進(jìn)制是32個1（1111 1111 1111 1111 1111 1111 1111 1111），左移29位后得到（1110 0000 0000 0000 0000 0000 0000 0000），然后111| 0還是111，同理可得其他狀態(tài)的 bit 位。這個位運(yùn)算很有意思，hashmap源碼中也用到了位運(yùn)算，小伙們在平時開發(fā)中也可以嘗試用下，這樣運(yùn)算速度會快，而且能夠裝b，介紹下這五種線程池的狀態(tài)

RUNNING：接收新任務(wù),并執(zhí)行隊(duì)列中的任務(wù)
SHUTDOWN：不接收新任務(wù),但是執(zhí)行隊(duì)列中的任務(wù)
STOP：不接收新任務(wù),不執(zhí)行隊(duì)列中的任務(wù),中斷正在執(zhí)行中的任務(wù)
TIDYING：所有的任務(wù)都已結(jié)束, 線程數(shù)量為 0,處于該狀態(tài)的線程池即將調(diào)用 terminated()方法
TERMINATED：terminated()方法執(zhí)行完成

他們的轉(zhuǎn)換關(guān)系如下：

addWorker方法

我們看到execute流程的核心方法為addWorker，我們繼續(xù)分析，源碼看起來比較唬人，其實(shí)就做了兩件事，拆分一下

第一步：更新worker的數(shù)量，代碼如下：

retry:
        for (;;) {
            int c = ctl.get();
            int rs = runStateOf(c);

            // Check if queue empty only if necessary.
            if (rs >= SHUTDOWN &&
                ! (rs == SHUTDOWN &&
                   firstTask == null &&
                   ! workQueue.isEmpty()))
                return false;

            for (;;) {
                int wc = workerCountOf(c);
                if (wc >= CAPACITY ||
                    wc >= (core ? corePoolSize : maximumPoolSize))
                    return false;
                if (compareAndIncrementWorkerCount(c))
                    break retry;
                c = ctl.get();  // Re-read ctl
                if (runStateOf(c) != rs)
                    continue retry;
                // else CAS failed due to workerCount change; retry inner loop
            }
        }
復(fù)制代碼

retry是一個標(biāo)記，和循環(huán)配合使用，continue retry 的時候，會跳到 retry 的地方再次執(zhí)行。如果 break retry，則跳出整個循環(huán)體。源碼先獲取到 ctl，然后檢查狀態(tài)，然后根據(jù)創(chuàng)建線程類型的不同，進(jìn)行數(shù)量的校驗(yàn)。在通過CAS方式更新 ctl狀態(tài)，成功的話則跳出循環(huán)。否則再次取得線程池狀態(tài)，如果和最初已經(jīng)不一致，那么從頭開始執(zhí)行。如果狀態(tài)并未改變則繼續(xù)更新worker的數(shù)量。流程圖如下：

第二步：添加 worker 到 workers 的 set 中。并且啟動 worker 中持有的線程。代碼如下：

boolean workerStarted = false;
boolean workerAdded = false;
Worker w = null;
try {
    w = new Worker(firstTask);
    final Thread t = w.thread;
    if (t != null) {
        final ReentrantLock mainLock = this.mainLock;
        mainLock.lock();
        try {
            // Recheck while holding lock.
            // Back out on ThreadFactory failure or if
            // shut down before lock acquired.
            int rs = runStateOf(ctl.get());

            if (rs < SHUTDOWN ||
                (rs == SHUTDOWN && firstTask == null)) {
                if (t.isAlive()) // precheck that t is startable
                    throw new IllegalThreadStateException();
                workers.add(w);
                int s = workers.size();
                if (s > largestPoolSize)
                    largestPoolSize = s;
                workerAdded = true;
            }
        } finally {
            mainLock.unlock();
        }
        if (workerAdded) {
            t.start();
            workerStarted = true;
        }
    }
} finally {
    if (! workerStarted)
        addWorkerFailed(w);
}
return workerStarted;
復(fù)制代碼

可以看到添加 work 時需要先獲得鎖，這樣確保多線程并發(fā)安全。如果添加 worker 成功，那么調(diào)用 worker 中線程的 start 方法啟動線程。如果啟動失敗則調(diào)用 addWorkerFailed 方法進(jìn)行回滾。看到這里小伙們會發(fā)現(xiàn)

1、ThreadPoolExecutor在初始化后并沒有啟動和創(chuàng)建任何線程，在調(diào)用 execute方法時才會調(diào)用 addWorker創(chuàng)建線程

2、addWorker方法中會創(chuàng)建新的worker，并啟動其持有的線程來執(zhí)行任務(wù)。

上文提到如果線程數(shù)量已經(jīng)達(dá)到corePoolSize，則只會把command 加入到 workQueue中，那么加入到 workQueue中的command是如何被執(zhí)行的呢？下面我們來分析 Worker 的源代碼。

Worker類

Worker封裝了線程，是executor中的工作單元。worker繼承自AbstractQueuedSynchronizer，并實(shí)現(xiàn) Runnable。 Worker 簡單理解其實(shí)就是一個線程，里面重新了 run 方法，我們來看他的構(gòu)造方法：

        Worker(Runnable firstTask) {
            setState(-1); // inhibit interrupts until runWorker
            this.firstTask = firstTask;
            this.thread = getThreadFactory().newThread(this);
        }
復(fù)制代碼

再來看下這兩個重要的屬性

        /** Thread this worker is running in.  Null if factory fails. */
        final Thread thread;
        /** Initial task to run.  Possibly null. */
        Runnable firstTask;
復(fù)制代碼

firstTask 用它來保存?zhèn)魅氲娜蝿?wù)；thread 是在調(diào)用構(gòu)造方法時通過 ThreadFactory 來創(chuàng)建的線程，是用來處理任務(wù)的線程，這里用的是 ThreadFactory 創(chuàng)建線程，并沒有直接 new，原因上文也提到過，這里看下 newThread 傳入的是 this，因?yàn)?Worker 本身繼承了 Runnable 接口，所以 addWork 中調(diào)用的 t.start()，實(shí)際上運(yùn)行的是 t 所屬 worker 的 run 方法。worker 的 run 方法如下：

public void run() {
    runWorker(this);
}
復(fù)制代碼

runWorker源碼再如下：

    final void runWorker(Worker w) {
        Thread wt = Thread.currentThread();
        Runnable task = w.firstTask;
        w.firstTask = null;
        w.unlock(); // allow interrupts
        boolean completedAbruptly = true;
        try {
            while (task != null || (task = getTask()) != null) {
                w.lock();
                // If pool is stopping, ensure thread is interrupted;
                // if not, ensure thread is not interrupted.  This
                // requires a recheck in second case to deal with
                // shutdownNow race while clearing interrupt
                if ((runStateAtLeast(ctl.get(), STOP) ||
                     (Thread.interrupted() &&
                      runStateAtLeast(ctl.get(), STOP))) &&
                    !wt.isInterrupted())
                    wt.interrupt();
                try {
                    beforeExecute(wt, task);
                    Throwable thrown = null;
                    try {
                        task.run();
                    } catch (RuntimeException x) {
                        thrown = x; throw x;
                    } catch (Error x) {
                        thrown = x; throw x;
                    } catch (Throwable x) {
                        thrown = x; throw new Error(x);
                    } finally {
                        afterExecute(task, thrown);
                    }
                } finally {
                    task = null;
                    w.completedTasks++;
                    w.unlock();
                }
            }
            completedAbruptly = false;
        } finally {
            processWorkerExit(w, completedAbruptly);
        }
    }
復(fù)制代碼

簡單分析一下

1、先取出 worker 中的 firstTask，并清空；

2、如果沒有 firstTask，則調(diào)用 getTask 方法，從 workQueue 中獲取task；

3、獲取鎖；

4、執(zhí)行 beforeExecute。這里是空方法，如有需要在子類實(shí)現(xiàn)；

5、執(zhí)行 task.run；

6、執(zhí)行 afterExecute。這里是空方法，如有需要在子類實(shí)現(xiàn)；

7、清空 task，completedTasks++，釋放鎖；

8、當(dāng)有異常或者沒有 task 可執(zhí)行時，會進(jìn)入外層 finnaly 代碼塊。調(diào)用 processWorkerExit 退出當(dāng)前 worker。從 works 中移除本 worker 后，如果 worker 數(shù)量小于 corePoolSize，則創(chuàng)建新的 worker，以維持 corePoolSize 大小的線程數(shù)。

這行代碼 while (task != null || (task = getTask()) != null) ，確保了 worker 不停地從 workQueue 中取得 task 執(zhí)行。getTask 方法會從 BlockingQueue workQueue 中 poll 或者 take 其中的 task 出來。

至此，關(guān)于 executor 如何創(chuàng)建并啟動線程執(zhí)行 task 的過程已經(jīng)分析的清清楚楚，明明白白，后面還有shutdown()、shutdownNow()等其他方法留給小伙們自行去觀察研究哈。

如何合理配置線程池的大小

線程池大小不是靠猜，也不是說越多越好。

CPU 密集型任務(wù)：主要是執(zhí)行計算任務(wù)，響應(yīng)時間很快，CPU 一直在運(yùn)行，這種任務(wù) CPU 的利用率很高，那么線程數(shù)的配置應(yīng)該根據(jù) CPU 核心數(shù)來決定，應(yīng)當(dāng)分配較少的線程，比如和 CPU 個數(shù)相當(dāng)?shù)拇笮　?/li>
IO 密集型任務(wù)：主要是進(jìn)行 IO 操作，執(zhí)行 IO 操作的時間較長，由于線程并不是一直在運(yùn)行，這時 CPU 處于空閑狀態(tài)，這種情況下可以增加線程池的大小，比如 CPU 個數(shù) * 2

當(dāng)然這些都是經(jīng)驗(yàn)值，最好的方式還是根據(jù)實(shí)際情況測試得出最佳配置。

線程池的監(jiān)控

如果在項(xiàng)目中大規(guī)模的使用了線程池，那么必須要有一套監(jiān)控體系，來指導(dǎo)當(dāng)前線程池的狀態(tài)，當(dāng)出現(xiàn)問題的時候可以快速定位到問題。我們通過重寫線程池的 beforeExecute、afterExecute 和 shutdown 等方式就可以實(shí)現(xiàn)對線程的監(jiān)控

看這些名稱和定義都知道，這是讓子類來實(shí)現(xiàn)的，可以在線程執(zhí)行前、后、終止?fàn)顟B(tài)執(zhí)行自定義邏輯。

總結(jié)

線程池這東西說簡單也簡單，說難也難，簡單是因?yàn)橛闷饋砗唵危孕』飩兛赡苡X得這有啥好講的，難是難在要知道他的底層的源碼，他是如何調(diào)度線程的，說兩點(diǎn)吧，第一是本文中用了大量的流程圖，當(dāng)我們在閱讀源碼或者做復(fù)雜業(yè)務(wù)開發(fā)的時候，一定要靜下心來先畫個圖，否則會被繞暈或者被別人打斷后，又得從頭到尾的看一邊，第二是閱讀源碼，剛畢業(yè)的小伙伴可能只要會用行了，但是如果你工作五年了，還是只會用，而不知道他里面是如何實(shí)現(xiàn)的，那你比剛畢業(yè)的優(yōu)勢在哪里，憑什么工資比剛畢業(yè)的高。如果你覺得寫的不錯，請點(diǎn)一個贊！