您好,登錄后才能下訂單哦!
如何從源碼上分析JUC線程池ThreadPoolExecutor的實現(xiàn)原理,相信很多沒有經(jīng)驗的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。
很早之前就打算看一次JUC線程池ThreadPoolExecutor
的源碼實現(xiàn),由于近段時間比較忙,一直沒有時間整理出源碼分析的文章。之前在分析擴展線程池實現(xiàn)可回調(diào)的Future
時候曾經(jīng)提到并發(fā)大師Doug Lea
在設(shè)計線程池ThreadPoolExecutor
的提交任務(wù)的頂層接口Executor
只有一個無狀態(tài)的執(zhí)行方法:
public interface Executor {
void execute(Runnable command);
}
而ExecutorService
提供了很多擴展方法底層基本上是基于Executor#execute()
方法進行擴展。本文著重分析ThreadPoolExecutor#execute()
的實現(xiàn),筆者會從實現(xiàn)原理、源碼實現(xiàn)等角度結(jié)合簡化例子進行詳細的分析。ThreadPoolExecutor
的源碼從JDK8
到JDK11
基本沒有變化,本文編寫的時候使用的是JDK11
。
ThreadPoolExecutor
里面使用到JUC同步器框架AbstractQueuedSynchronizer
(俗稱AQS
)、大量的位操作、CAS
操作。ThreadPoolExecutor
提供了固定活躍線程(核心線程)、額外的線程(線程池容量 - 核心線程數(shù)這部分額外創(chuàng)建的線程,下面稱為非核心線程)、任務(wù)隊列以及拒絕策略這幾個重要的功能。
ThreadPoolExecutor
里面使用到JUC同步器框架,主要用于四個方面:
mainLock
成員屬性,是可重入鎖
ReentrantLock
類型,主要是用于訪問工作線程
Worker
集合和進行數(shù)據(jù)統(tǒng)計記錄時候的加鎖操作。termination
,
Condition
類型,主要用于線程進行等待終結(jié)
awaitTermination()
方法時的帶期限阻塞。workQueue
,
BlockingQueue<Runnable>
類型,任務(wù)隊列,用于存放待執(zhí)行的任務(wù)。Worker
類型,是線程池中真正的工作線程對象。關(guān)于AQS
筆者之前寫過一篇相關(guān)源碼分析的文章:JUC同步器框架AbstractQueuedSynchronizer源碼圖文分析。
這里先參考ThreadPoolExecutor
的實現(xiàn)并且進行簡化,實現(xiàn)一個只有核心線程的線程池,要求如下:
public class CoreThreadPool implements Executor {
private BlockingQueue<Runnable> workQueue;
private static final AtomicInteger COUNTER = new AtomicInteger();
private int coreSize;
private int threadCount = 0;
public CoreThreadPool(int coreSize) {
this.coreSize = coreSize;
this.workQueue = new LinkedBlockingQueue<>();
}
@Override
public void execute(Runnable command) {
if (++threadCount <= coreSize) {
new Worker(command).start();
} else {
try {
workQueue.put(command);
} catch (InterruptedException e) {
throw new IllegalStateException(e);
}
}
}
private class Worker extends Thread {
private Runnable firstTask;
public Worker(Runnable runnable) {
super(String.format("Worker-%d", COUNTER.getAndIncrement()));
this.firstTask = runnable;
}
@Override
public void run() {
Runnable task = this.firstTask;
while (null != task || null != (task = getTask())) {
try {
task.run();
} finally {
task = null;
}
}
}
}
private Runnable getTask() {
try {
return workQueue.take();
} catch (InterruptedException e) {
throw new IllegalStateException(e);
}
}
public static void main(String[] args) throws Exception {
CoreThreadPool pool = new CoreThreadPool(5);
IntStream.range(0, 10)
.forEach(i -> pool.execute(() ->
System.out.println(String.format("Thread:%s,value:%d", Thread.currentThread().getName(), i))));
Thread.sleep(Integer.MAX_VALUE);
}
}
某次運行結(jié)果如下:
Thread:Worker-0,value:0
Thread:Worker-3,value:3
Thread:Worker-2,value:2
Thread:Worker-1,value:1
Thread:Worker-4,value:4
Thread:Worker-1,value:5
Thread:Worker-2,value:8
Thread:Worker-4,value:7
Thread:Worker-0,value:6
Thread:Worker-3,value:9
設(shè)計此線程池的時候,核心線程是懶創(chuàng)建的,如果線程空閑的時候則阻塞在任務(wù)隊列的take()
方法,其實對于ThreadPoolExecutor
也是類似這樣實現(xiàn),只是如果使用了keepAliveTime
并且允許核心線程超時(allowCoreThreadTimeOut
設(shè)置為true
)則會使用BlockingQueue#poll(keepAliveTime)
進行輪詢代替永久阻塞。
構(gòu)建ThreadPoolExecutor
實例的時候,需要定義maximumPoolSize
(線程池最大線程數(shù))和corePoolSize
(核心線程數(shù))。當(dāng)任務(wù)隊列是有界的阻塞隊列,核心線程滿負載,任務(wù)隊列已經(jīng)滿的情況下,會嘗試創(chuàng)建額外的maximumPoolSize - corePoolSize
個線程去執(zhí)行新提交的任務(wù)。當(dāng)ThreadPoolExecutor
這里實現(xiàn)的兩個主要附加功能是:
keepAliveTime
,線程生命周期終結(jié)的條件是:下一次通過任務(wù)隊列獲取任務(wù)的時候并且存活時間超過
keepAliveTime
。先分析線程池的關(guān)鍵屬性,接著分析其狀態(tài)控制,最后重點分析ThreadPoolExecutor#execute()
方法。
public class ThreadPoolExecutor extends AbstractExecutorService {
// 控制變量-存放狀態(tài)和線程數(shù)
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// 任務(wù)隊列,必須是阻塞隊列
private final BlockingQueue<Runnable> workQueue;
// 工作線程集合,存放線程池中所有的(活躍的)工作線程,只有在持有全局鎖mainLock的前提下才能訪問此集合
private final HashSet<Worker> workers = new HashSet<>();
// 全局鎖
private final ReentrantLock mainLock = new ReentrantLock();
// awaitTermination方法使用的等待條件變量
private final Condition termination = mainLock.newCondition();
// 記錄峰值線程數(shù)
private int largestPoolSize;
// 記錄已經(jīng)成功執(zhí)行完畢的任務(wù)數(shù)
private long completedTaskCount;
// 線程工廠,用于創(chuàng)建新的線程實例
private volatile ThreadFactory threadFactory;
// 拒絕執(zhí)行處理器,對應(yīng)不同的拒絕策略
private volatile RejectedExecutionHandler handler;
// 空閑線程等待任務(wù)的時間周期,單位是納秒
private volatile long keepAliveTime;
// 是否允許核心線程超時,如果為true則keepAliveTime對核心線程也生效
private volatile boolean allowCoreThreadTimeOut;
// 核心線程數(shù)
private volatile int corePoolSize;
// 線程池容量
private volatile int maximumPoolSize;
// 省略其他代碼
}
下面看參數(shù)列表最長的構(gòu)造函數(shù):
public ThreadPoolExecutor(int corePoolSize,
int maximumPoolSize,
long keepAliveTime,
TimeUnit unit,
BlockingQueue<Runnable> workQueue,
ThreadFactory threadFactory,
RejectedExecutionHandler handler) {
if (corePoolSize < 0 ||
maximumPoolSize <= 0 ||
maximumPoolSize < corePoolSize ||
keepAliveTime < 0)
throw new IllegalArgumentException();
if (workQueue == null || threadFactory == null || handler == null)
throw new NullPointerException();
this.corePoolSize = corePoolSize;
this.maximumPoolSize = maximumPoolSize;
this.workQueue = workQueue;
this.keepAliveTime = unit.toNanos(keepAliveTime);
this.threadFactory = threadFactory;
this.handler = handler;
}
可以自定義核心線程數(shù)、線程池容量(最大線程數(shù))、空閑線程等待任務(wù)周期、任務(wù)隊列、線程工廠、拒絕策略。下面簡單分析一下每個參數(shù)的含義和作用:
corePoolSize
」:int類型,核心線程數(shù)量。maximumPoolSize
」:int類型,最大線程數(shù)量,也就是線程池的容量。keepAliveTime
」:long類型,線程空閑等待時間,也和工作線程的生命周期有關(guān),下文會分析。unit
」:
TimeUnit
類型,
keepAliveTime
參數(shù)的時間單位,實際上
keepAliveTime
最終會轉(zhuǎn)化為納秒。workQueue
」:
BlockingQueue<Runnable>
類型,等待隊列或者叫任務(wù)隊列。threadFactory
」:
ThreadFactory
類型,線程工廠,用于創(chuàng)建工作線程(包括核心線程和非核心線程),默認使用
Executors.defaultThreadFactory()
作為內(nèi)建線程工廠實例,一般自定義線程工廠才能更好地跟蹤工作線程。handler
」:
RejectedExecutionHandler
類型,線程池的拒絕執(zhí)行處理器,更多時候稱為拒絕策略,拒絕策略執(zhí)行的時機是當(dāng)阻塞隊列已滿、沒有空閑的線程(包括核心線程和非核心線程)并且繼續(xù)提交任務(wù)。提供了4種內(nèi)建的拒絕策略實現(xiàn):AbortPolicy
:直接拒絕策略,也就是不會執(zhí)行任務(wù),直接拋出
RejectedExecutionException
,這是
「默認的拒絕策略」。DiscardPolicy
:拋棄策略,也就是直接忽略提交的任務(wù)(通俗來說就是空實現(xiàn))。DiscardOldestPolicy
:拋棄最老任務(wù)策略,也就是通過
poll()
方法取出任務(wù)隊列隊頭的任務(wù)拋棄,然后執(zhí)行當(dāng)前提交的任務(wù)。CallerRunsPolicy
:調(diào)用者執(zhí)行策略,也就是當(dāng)前調(diào)用
Executor#execute()
的線程直接調(diào)用任務(wù)
Runnable#run()
,
「一般不希望任務(wù)丟失會選用這種策略,但從實際角度來看,原來的異步調(diào)用意圖會退化為同步調(diào)用」。狀態(tài)控制主要圍繞原子整型成員變量ctl
:
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int COUNT_MASK = (1 << COUNT_BITS) - 1;
private static final int RUNNING = -1 << COUNT_BITS;
private static final int SHUTDOWN = 0 << COUNT_BITS;
private static final int STOP = 1 << COUNT_BITS;
private static final int TIDYING = 2 << COUNT_BITS;
private static final int TERMINATED = 3 << COUNT_BITS;
// 通過ctl值獲取運行狀態(tài)
private static int runStateOf(int c) { return c & ~COUNT_MASK; }
// 通過ctl值獲取工作線程數(shù)
private static int workerCountOf(int c) { return c & COUNT_MASK; }
// 通過運行狀態(tài)和工作線程數(shù)計算ctl的值,或運算
private static int ctlOf(int rs, int wc) { return rs | wc; }
private static boolean runStateLessThan(int c, int s) {
return c < s;
}
private static boolean runStateAtLeast(int c, int s) {
return c >= s;
}
private static boolean isRunning(int c) {
return c < SHUTDOWN;
}
// CAS操作線程數(shù)增加1
private boolean compareAndIncrementWorkerCount(int expect) {
return ctl.compareAndSet(expect, expect + 1);
}
// CAS操作線程數(shù)減少1
private boolean compareAndDecrementWorkerCount(int expect) {
return ctl.compareAndSet(expect, expect - 1);
}
// 線程數(shù)直接減少1
private void decrementWorkerCount() {
ctl.addAndGet(-1);
}
接下來分析一下線程池的狀態(tài)變量,工作線程上限數(shù)量位的長度是COUNT_BITS
,它的值是Integer.SIZE - 3
,也就是正整數(shù)29:
?我們知道,整型包裝類型Integer實例的大小是4 byte,一共32 bit,也就是一共有32個位用于存放0或者1。在ThreadPoolExecutor實現(xiàn)中,使用32位的整型包裝類型存放工作線程數(shù)和線程池狀態(tài)。其中,低29位用于存放工作線程數(shù),而高3位用于存放線程池狀態(tài),所以線程池的狀態(tài)最多只能有2^3種。工作線程上限數(shù)量為2^29 - 1,超過5億,這個數(shù)量在短時間內(nèi)不用考慮會超限。
?
接著看工作線程上限數(shù)量掩碼COUNT_MASK
,它的值是(1 < COUNT_BITS) - l
,也就是1左移29位,再減去1,如果補全32位,它的位視圖如下:
然后就是線程池的狀態(tài)常量,這里只詳細分析其中一個,其他類同,這里看RUNNING
狀態(tài):
// -1的補碼為:111-11111111111111111111111111111
// 左移29位后:111-00000000000000000000000000000
// 10進制值為:-536870912
// 高3位111的值就是表示線程池正在處于運行狀態(tài)
private static final int RUNNING = -1 << COUNT_BITS;
控制變量ctl
的組成就是通過線程池運行狀態(tài)rs
和工作線程數(shù)wc
通過「或運算」得到的:
// rs=RUNNING值為:111-00000000000000000000000000000
// wc的值為0:000-00000000000000000000000000000
// rs | wc的結(jié)果為:111-00000000000000000000000000000
private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
private static int ctlOf(int rs, int wc) {
return rs | wc;
}
那么我們怎么從ctl
中取出高3位?上面源碼中提供的runStateOf()
方法就是提取運行狀態(tài):
// 先把COUNT_MASK取反(~COUNT_MASK),得到:111-00000000000000000000000000000
// ctl位圖特點是:xxx-yyyyyyyyyyyyyyyyyyyyyyyyyyyyyy
// 兩者做一次與運算即可得到高3位xxx
private static int runStateOf(int c){
return c & ~COUNT_MASK;
}
同理,取出低29位只需要把ctl
和COUNT_MASK
(000-11111111111111111111111111111
)做一次與運算即可。
小結(jié)一下線程池的運行狀態(tài)常量:
狀態(tài)名稱 | 位圖 | 十進制值 | 描述 |
---|---|---|---|
RUNNING | 111-00000000000000000000000000000 | -536870912 | 運行中狀態(tài),可以接收新的任務(wù)和執(zhí)行任務(wù)隊列中的任務(wù) |
SHUTDOWN | 000-00000000000000000000000000000 | 0 | shutdown狀態(tài),不再接收新的任務(wù),但是會執(zhí)行任務(wù)隊列中的任務(wù) |
STOP | 001-00000000000000000000000000000 | 536870912 | 停止?fàn)顟B(tài),不再接收新的任務(wù),也不會執(zhí)行任務(wù)隊列中的任務(wù),中斷所有執(zhí)行中的任務(wù) |
TIDYING | 010-00000000000000000000000000000 | 1073741824 | 整理中狀態(tài),所有任務(wù)已經(jīng)終結(jié),工作線程數(shù)為0,過渡到此狀態(tài)的工作線程會調(diào)用鉤子方法terminated() |
TERMINATED | 011-00000000000000000000000000000 | 1610612736 | 終結(jié)狀態(tài),鉤子方法terminated() 執(zhí)行完畢 |
這里有一個比較特殊的技巧,由于運行狀態(tài)值存放在高3位,所以可以直接通過十進制值(「甚至可以忽略低29位,直接用ctl
進行比較,或者使用ctl
和線程池狀態(tài)常量進行比較」)來比較和判斷線程池的狀態(tài):
?RUNNING(-536870912) < SHUTDOWN(0) < STOP(536870912) < TIDYING(1073741824) < TERMINATED(1610612736)
?
下面這三個方法就是使用這種技巧:
// ctl和狀態(tài)常量比較,判斷是否小于
private static boolean runStateLessThan(int c, int s) {
return c < s;
}
// ctl和狀態(tài)常量比較,判斷是否小于或等于
private static boolean runStateAtLeast(int c, int s) {
return c >= s;
}
// ctl和狀態(tài)常量SHUTDOWN比較,判斷是否處于RUNNING狀態(tài)
private static boolean isRunning(int c) {
return c < SHUTDOWN;
}
最后是線程池狀態(tài)的躍遷圖:
?PS:線程池源碼中有很多中間變量用了簡單的單字母表示,例如c就是表示ctl、wc就是表示worker count、rs就是表示running status。
?
線程池異步執(zhí)行任務(wù)的方法實現(xiàn)是ThreadPoolExecutor#execute()
,源碼如下:
// 執(zhí)行命令,其中命令(下面稱任務(wù))對象是Runnable的實例
public void execute(Runnable command) {
// 判斷命令(任務(wù))對象非空
if (command == null)
throw new NullPointerException();
// 獲取ctl的值
int c = ctl.get();
// 判斷如果當(dāng)前工作線程數(shù)小于核心線程數(shù),則創(chuàng)建新的核心線程并且執(zhí)行傳入的任務(wù)
if (workerCountOf(c) < corePoolSize) {
if (addWorker(command, true))
// 如果創(chuàng)建新的核心線程成功則直接返回
return;
// 這里說明創(chuàng)建核心線程失敗,需要更新ctl的臨時變量c
c = ctl.get();
}
// 走到這里說明創(chuàng)建新的核心線程失敗,也就是當(dāng)前工作線程數(shù)大于等于corePoolSize
// 判斷線程池是否處于運行中狀態(tài),同時嘗試用非阻塞方法向任務(wù)隊列放入任務(wù)(放入任務(wù)失敗返回false)
if (isRunning(c) && workQueue.offer(command)) {
int recheck = ctl.get();
// 這里是向任務(wù)隊列投放任務(wù)成功,對線程池的運行中狀態(tài)做二次檢查
// 如果線程池二次檢查狀態(tài)是非運行中狀態(tài),則從任務(wù)隊列移除當(dāng)前的任務(wù)調(diào)用拒絕策略處理之(也就是移除前面成功入隊的任務(wù)實例)
if (! isRunning(recheck) && remove(command))
// 調(diào)用拒絕策略處理任務(wù) - 返回
reject(command);
// 走到下面的else if分支,說明有以下的前提:
// 0、待執(zhí)行的任務(wù)已經(jīng)成功加入任務(wù)隊列
// 1、線程池可能是RUNNING狀態(tài)
// 2、傳入的任務(wù)可能從任務(wù)隊列中移除失?。ㄒ瞥〉奈ㄒ豢赡芫褪侨蝿?wù)已經(jīng)被執(zhí)行了)
// 如果當(dāng)前工作線程數(shù)量為0,則創(chuàng)建一個非核心線程并且傳入的任務(wù)對象為null - 返回
// 也就是創(chuàng)建的非核心線程不會馬上運行,而是等待獲取任務(wù)隊列的任務(wù)去執(zhí)行
// 如果前工作線程數(shù)量不為0,原來應(yīng)該是最后的else分支,但是可以什么也不做,因為任務(wù)已經(jīng)成功入隊列,總會有合適的時機分配其他空閑線程去執(zhí)行它
else if (workerCountOf(recheck) == 0)
addWorker(null, false);
}
// 走到這里說明有以下的前提:
// 0、線程池中的工作線程總數(shù)已經(jīng)大于等于corePoolSize(簡單來說就是核心線程已經(jīng)全部懶創(chuàng)建完畢)
// 1、線程池可能不是RUNNING狀態(tài)
// 2、線程池可能是RUNNING狀態(tài)同時任務(wù)隊列已經(jīng)滿了
// 如果向任務(wù)隊列投放任務(wù)失敗,則會嘗試創(chuàng)建非核心線程傳入任務(wù)執(zhí)行
// 創(chuàng)建非核心線程失敗,此時需要拒絕執(zhí)行任務(wù)
else if (!addWorker(command, false))
// 調(diào)用拒絕策略處理任務(wù) - 返回
reject(command);
}
這里簡單分析一下整個流程:
corePoolSize
,則直接創(chuàng)建核心線程執(zhí)行任務(wù)(任務(wù)實例會傳入直接用于構(gòu)造工作線程實例)。corePoolSize
,判斷線程池是否處于運行中狀態(tài),同時嘗試用非阻塞方法向任務(wù)隊列放入任務(wù),這里會二次檢查線程池運行狀態(tài),如果當(dāng)前工作線程數(shù)量為0,則創(chuàng)建一個非核心線程并且傳入的任務(wù)對象為null。「這里是一個疑惑點」:為什么需要二次檢查線程池的運行狀態(tài),當(dāng)前工作線程數(shù)量為0,嘗試創(chuàng)建一個非核心線程并且傳入的任務(wù)對象為null?這個可以看API注釋:
?如果一個任務(wù)成功加入任務(wù)隊列,我們依然需要二次檢查是否需要添加一個工作線程(因為所有存活的工作線程有可能在最后一次檢查之后已經(jīng)終結(jié))或者執(zhí)行當(dāng)前方法的時候線程池是否已經(jīng)shutdown了。所以我們需要二次檢查線程池的狀態(tài),必須時把任務(wù)從任務(wù)隊列中移除或者在沒有可用的工作線程的前提下新建一個工作線程。
?
任務(wù)提交流程從調(diào)用者的角度來看如下:
boolean addWorker(Runnable firstTask, boolean core)
方法的第一的參數(shù)可以用于直接傳入任務(wù)實例,第二個參數(shù)用于標(biāo)識將要創(chuàng)建的工作線程是否核心線程。方法源碼如下:
// 添加工作線程,如果返回false說明沒有新創(chuàng)建工作線程,如果返回true說明創(chuàng)建和啟動工作線程成功
private boolean addWorker(Runnable firstTask, boolean core) {
retry:
// 注意這是一個死循環(huán) - 最外層循環(huán)
for (int c = ctl.get();;) {
// 這個是十分復(fù)雜的條件,這里先拆分多個與(&&)條件:
// 1. 線程池狀態(tài)至少為SHUTDOWN狀態(tài),也就是rs >= SHUTDOWN(0)
// 2. 線程池狀態(tài)至少為STOP狀態(tài),也就是rs >= STOP(1),或者傳入的任務(wù)實例firstTask不為null,或者任務(wù)隊列為空
// 其實這個判斷的邊界是線程池狀態(tài)為shutdown狀態(tài)下,不會再接受新的任務(wù),在此前提下如果狀態(tài)已經(jīng)到了STOP、或者傳入任務(wù)不為空、或者任務(wù)隊列為空(已經(jīng)沒有積壓任務(wù))都不需要添加新的線程
if (runStateAtLeast(c, SHUTDOWN)
&& (runStateAtLeast(c, STOP)
|| firstTask != null
|| workQueue.isEmpty()))
return false;
// 注意這也是一個死循環(huán) - 二層循環(huán)
for (;;) {
// 這里每一輪循環(huán)都會重新獲取工作線程數(shù)wc
// 1. 如果傳入的core為true,表示將要創(chuàng)建核心線程,通過wc和corePoolSize判斷,如果wc >= corePoolSize,則返回false表示創(chuàng)建核心線程失敗
// 1. 如果傳入的core為false,表示將要創(chuàng)非建核心線程,通過wc和maximumPoolSize判斷,如果wc >= maximumPoolSize,則返回false表示創(chuàng)建非核心線程失敗
if (workerCountOf(c)
>= ((core ? corePoolSize : maximumPoolSize) & COUNT_MASK))
return false;
// 成功通過CAS更新工作線程數(shù)wc,則break到最外層的循環(huán)
if (compareAndIncrementWorkerCount(c))
break retry;
// 走到這里說明了通過CAS更新工作線程數(shù)wc失敗,這個時候需要重新判斷線程池的狀態(tài)是否由RUNNING已經(jīng)變?yōu)镾HUTDOWN
c = ctl.get(); // Re-read ctl
// 如果線程池狀態(tài)已經(jīng)由RUNNING已經(jīng)變?yōu)镾HUTDOWN,則重新跳出到外層循環(huán)繼續(xù)執(zhí)行
if (runStateAtLeast(c, SHUTDOWN))
continue retry;
// 如果線程池狀態(tài)依然是RUNNING,CAS更新工作線程數(shù)wc失敗說明有可能是并發(fā)更新導(dǎo)致的失敗,則在內(nèi)層循環(huán)重試即可
// else CAS failed due to workerCount change; retry inner loop
}
}
// 標(biāo)記工作線程是否啟動成功
boolean workerStarted = false;
// 標(biāo)記工作線程是否創(chuàng)建成功
boolean workerAdded = false;
Worker w = null;
try {
// 傳入任務(wù)實例firstTask創(chuàng)建Worker實例,Worker構(gòu)造里面會通過線程工廠創(chuàng)建新的Thread對象,所以下面可以直接操作Thread t = w.thread
// 這一步Worker實例已經(jīng)創(chuàng)建,但是沒有加入工作線程集合或者啟動它持有的線程Thread實例
w = new Worker(firstTask);
final Thread t = w.thread;
if (t != null) {
// 這里需要全局加鎖,因為會改變一些指標(biāo)值和非線程安全的集合
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// Recheck while holding lock.
// Back out on ThreadFactory failure or if
// shut down before lock acquired.
int c = ctl.get();
// 這里主要在加鎖的前提下判斷ThreadFactory創(chuàng)建的線程是否存活或者判斷獲取鎖成功之后線程池狀態(tài)是否已經(jīng)更變?yōu)镾HUTDOWN
// 1. 如果線程池狀態(tài)依然為RUNNING,則只需要判斷線程實例是否存活,需要添加到工作線程集合和啟動新的Worker
// 2. 如果線程池狀態(tài)小于STOP,也就是RUNNING或者SHUTDOWN狀態(tài)下,同時傳入的任務(wù)實例firstTask為null,則需要添加到工作線程集合和啟動新的Worker
// 對于2,換言之,如果線程池處于SHUTDOWN狀態(tài)下,同時傳入的任務(wù)實例firstTask不為null,則不會添加到工作線程集合和啟動新的Worker
// 這一步其實有可能創(chuàng)建了新的Worker實例但是并不啟動(臨時對象,沒有任何強引用),這種Worker有可能成功下一輪GC被收集的垃圾對象
if (isRunning(c) ||
(runStateLessThan(c, STOP) && firstTask == null)) {
if (t.isAlive()) // precheck that t is startable
throw new IllegalThreadStateException();
// 把創(chuàng)建的工作線程實例添加到工作線程集合
workers.add(w);
int s = workers.size();
// 嘗試更新歷史峰值工作線程數(shù),也就是線程池峰值容量
if (s > largestPoolSize)
largestPoolSize = s;
// 這里更新工作線程是否啟動成功標(biāo)識為true,后面才會調(diào)用Thread#start()方法啟動真實的線程實例
workerAdded = true;
}
} finally {
mainLock.unlock();
}
// 如果成功添加工作線程,則調(diào)用Worker內(nèi)部的線程實例t的Thread#start()方法啟動真實的線程實例
if (workerAdded) {
t.start();
// 標(biāo)記線程啟動成功
workerStarted = true;
}
}
} finally {
// 線程啟動失敗,需要從工作線程集合移除對應(yīng)的Worker
if (! workerStarted)
addWorkerFailed(w);
}
return workerStarted;
}
// 添加Worker失敗
private void addWorkerFailed(Worker w) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 從工作線程集合移除之
if (w != null)
workers.remove(w);
// wc數(shù)量減1
decrementWorkerCount();
// 基于狀態(tài)判斷嘗試終結(jié)線程池
tryTerminate();
} finally {
mainLock.unlock();
}
}
筆者發(fā)現(xiàn)了Doug Lea
大神十分喜歡復(fù)雜的條件判斷,而且單行復(fù)雜判斷不喜歡加花括號,像下面這種代碼在他編寫的很多類庫中都比較常見:
if (runStateAtLeast(c, SHUTDOWN)
&& (runStateAtLeast(c, STOP)
|| firstTask != null
|| workQueue.isEmpty()))
return false;
// ....
// 代碼拆分一下如下
boolean atLeastShutdown = runStateAtLeast(c, SHUTDOWN); # rs >= SHUTDOWN(0)
boolean atLeastStop = runStateAtLeast(c, STOP) || firstTask != null || workQueue.isEmpty();
if (atLeastShutdown && atLeastStop){
return false;
}
上面的分析邏輯中需要注意一點,Worker
實例創(chuàng)建的同時,在其構(gòu)造函數(shù)中會通過ThreadFactory
創(chuàng)建一個Java線程Thread
實例,后面會加鎖后二次檢查是否需要把Worker
實例添加到工作線程集合workers
中和是否需要啟動Worker
中持有的Thread
實例,只有啟動了Thread
實例實例,Worker
才真正開始運作,否則只是一個無用的臨時對象。Worker
本身也實現(xiàn)了Runnable
接口,它可以看成是一個Runnable
的適配器。
線程池中的每一個具體的工作線程被包裝為內(nèi)部類Worker
實例,Worker
繼承于AbstractQueuedSynchronizer(AQS)
,實現(xiàn)了Runnable
接口:
private final class Worker extends AbstractQueuedSynchronizer implements Runnable{
/**
* This class will never be serialized, but we provide a
* serialVersionUID to suppress a javac warning.
*/
private static final long serialVersionUID = 6138294804551838833L;
// 保存ThreadFactory創(chuàng)建的線程實例,如果ThreadFactory創(chuàng)建線程失敗則為null
final Thread thread;
// 保存?zhèn)魅氲腞unnable任務(wù)實例
Runnable firstTask;
// 記錄每個線程完成的任務(wù)總數(shù)
volatile long completedTasks;
// 唯一的構(gòu)造函數(shù),傳入任務(wù)實例firstTask,注意可以為null
Worker(Runnable firstTask) {
// 禁止線程中斷,直到runWorker()方法執(zhí)行
setState(-1); // inhibit interrupts until runWorker
this.firstTask = firstTask;
// 通過ThreadFactory創(chuàng)建線程實例,注意一下Worker實例自身作為Runnable用于創(chuàng)建新的線程實例
this.thread = getThreadFactory().newThread(this);
}
// 委托到外部的runWorker()方法,注意runWorker()方法是線程池的方法,而不是Worker的方法
public void run() {
runWorker(this);
}
// Lock methods
//
// The value 0 represents the unlocked state.
// The value 1 represents the locked state.
// 是否持有獨占鎖,state值為1的時候表示持有鎖,state值為0的時候表示已經(jīng)釋放鎖
protected boolean isHeldExclusively() {
return getState() != 0;
}
// 獨占模式下嘗試獲取資源,這里沒有判斷傳入的變量,直接CAS判斷0更新為1是否成功,成功則設(shè)置獨占線程為當(dāng)前線程
protected boolean tryAcquire(int unused) {
if (compareAndSetState(0, 1)) {
setExclusiveOwnerThread(Thread.currentThread());
return true;
}
return false;
}
// 獨占模式下嘗試是否資源,這里沒有判斷傳入的變量,直接把state設(shè)置為0
protected boolean tryRelease(int unused) {
setExclusiveOwnerThread(null);
setState(0);
return true;
}
// 加鎖
public void lock() { acquire(1); }
// 嘗試加鎖
public boolean tryLock() { return tryAcquire(1); }
// 解鎖
public void unlock() { release(1); }
// 是否鎖定
public boolean isLocked() { return isHeldExclusively(); }
// 啟動后進行線程中斷,注意這里會判斷線程實例的中斷標(biāo)志位是否為false,只有中斷標(biāo)志位為false才會中斷
void interruptIfStarted() {
Thread t;
if (getState() >= 0 && (t = thread) != null && !t.isInterrupted()) {
try {
t.interrupt();
} catch (SecurityException ignore) {
}
}
}
}
Worker
的構(gòu)造函數(shù)里面的邏輯十分重要,通過ThreadFactory
創(chuàng)建的Thread
實例同時傳入Worker
實例,因為Worker
本身實現(xiàn)了Runnable
,所以可以作為任務(wù)提交到線程中執(zhí)行。只要Worker
持有的線程實例w
調(diào)用Thread#start()
方法就能在合適時機執(zhí)行Worker#run()
。簡化一下邏輯如下:
// addWorker()方法中構(gòu)造
Worker worker = createWorker();
// 通過線程池構(gòu)造時候傳入
ThreadFactory threadFactory = getThreadFactory();
// Worker構(gòu)造函數(shù)中
Thread thread = threadFactory.newThread(worker);
// addWorker()方法中啟動
thread.start();
Worker
繼承自AQS
,這里使用了AQS
的獨占模式,這里有個技巧是構(gòu)造Worker
的時候,把AQS
的資源(狀態(tài))通過setState(-1)
設(shè)置為-1,這是因為Worker
實例剛創(chuàng)建時AQS
中state
的默認值為0,此時線程尚未啟動,不能在這個時候進行線程中斷,見Worker#interruptIfStarted()
方法。Worker
中兩個覆蓋AQS
的方法tryAcquire()
和tryRelease()
都沒有判斷外部傳入的變量,前者直接CAS(0,1)
,后者直接setState(0)
。接著看核心方法ThreadPoolExecutor#runWorker()
:
final void runWorker(Worker w) {
// 獲取當(dāng)前線程,實際上和Worker持有的線程實例是相同的
Thread wt = Thread.currentThread();
// 獲取Worker中持有的初始化時傳入的任務(wù)對象,這里注意存放在臨時變量task中
Runnable task = w.firstTask;
// 設(shè)置Worker中持有的初始化時傳入的任務(wù)對象為null
w.firstTask = null;
// 由于Worker初始化時AQS中state設(shè)置為-1,這里要先做一次解鎖把state更新為0,允許線程中斷
w.unlock(); // allow interrupts
// 記錄線程是否因為用戶異常終結(jié),默認是true
boolean completedAbruptly = true;
try {
// 初始化任務(wù)對象不為null,或者從任務(wù)隊列獲取任務(wù)不為空(從任務(wù)隊列獲取到的任務(wù)會更新到臨時變量task中)
// getTask()由于使用了阻塞隊列,這個while循環(huán)如果命中后半段會處于阻塞或者超時阻塞狀態(tài),getTask()返回為null會導(dǎo)致線程跳出死循環(huán)使線程終結(jié)
while (task != null || (task = getTask()) != null) {
// Worker加鎖,本質(zhì)是AQS獲取資源并且嘗試CAS更新state由0更變?yōu)?
w.lock();
// If pool is stopping, ensure thread is interrupted;
// if not, ensure thread is not interrupted. This
// requires a recheck in second case to deal with
// shutdownNow race while clearing interrupt
// 如果線程池正在停止(也就是由RUNNING或者SHUTDOWN狀態(tài)向STOP狀態(tài)變更),那么要確保當(dāng)前工作線程是中斷狀態(tài)
// 否則,要保證當(dāng)前線程不是中斷狀態(tài)
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
try {
// 鉤子方法,任務(wù)執(zhí)行前
beforeExecute(wt, task);
try {
task.run();
// 鉤子方法,任務(wù)執(zhí)行后 - 正常情況
afterExecute(task, null);
} catch (Throwable ex) {
// 鉤子方法,任務(wù)執(zhí)行后 - 異常情況
afterExecute(task, ex);
throw ex;
}
} finally {
// 清空task臨時變量,這個很重要,否則while會死循環(huán)執(zhí)行同一個task
task = null;
// 累加Worker完成的任務(wù)數(shù)
w.completedTasks++;
// Worker解鎖,本質(zhì)是AQS釋放資源,設(shè)置state為0
w.unlock();
}
}
// 走到這里說明某一次getTask()返回為null,線程正常退出
completedAbruptly = false;
} finally {
// 處理線程退出,completedAbruptly為true說明由于用戶異常導(dǎo)致線程非正常退出
processWorkerExit(w, completedAbruptly);
}
}
這里重點拆解分析一下判斷當(dāng)前工作線程中斷狀態(tài)的代碼:
if ((runStateAtLeast(ctl.get(), STOP) ||
(Thread.interrupted() &&
runStateAtLeast(ctl.get(), STOP))) &&
!wt.isInterrupted())
wt.interrupt();
// 先簡化一下判斷邏輯,如下
// 判斷線程池狀態(tài)是否至少為STOP,rs >= STOP(1)
boolean atLeastStop = runStateAtLeast(ctl.get(), STOP);
// 判斷線程池狀態(tài)是否至少為STOP,同時判斷當(dāng)前線程的中斷狀態(tài)并且清空當(dāng)前線程的中斷狀態(tài)
boolean interruptedAndAtLeastStop = Thread.interrupted() && runStateAtLeast(ctl.get(), STOP);
if (atLeastStop || interruptedAndAtLeastStop && !wt.isInterrupted()){
wt.interrupt();
}
Thread.interrupted()
方法獲取線程的中斷狀態(tài)同時會清空該中斷狀態(tài),這里之所以會調(diào)用這個方法是因為在執(zhí)行上面這個if
邏輯同時外部有可能調(diào)用shutdownNow()
方法,shutdownNow()
方法中也存在中斷所有Worker
線程的邏輯,但是由于shutdownNow()
方法中會遍歷所有Worker
做線程中斷,有可能無法及時在任務(wù)提交到Worker
執(zhí)行之前進行中斷,所以這個中斷邏輯會在Worker
內(nèi)部執(zhí)行,就是if
代碼塊的邏輯。這里還要注意的是:STOP
狀態(tài)下會拒絕所有新提交的任務(wù),不會再執(zhí)行任務(wù)隊列中的任務(wù),同時會中斷所有Worker
線程。也就是,「即使任務(wù)Runnable已經(jīng)runWorker()
中前半段邏輯取出,只要還沒走到調(diào)用其Runnable#run(),都有可能被中斷」。假設(shè)剛好發(fā)生了進入if
代碼塊的邏輯同時外部調(diào)用了shutdownNow()
方法,那么if
邏輯內(nèi)會判斷線程中斷狀態(tài)并且重置,那么shutdownNow()
方法中調(diào)用的interruptWorkers()
就不會因為中斷狀態(tài)判斷出現(xiàn)問題導(dǎo)致二次中斷線程(會導(dǎo)致異常)。
小結(jié)一下上面runWorker()
方法的核心流程:
Worker
先執(zhí)行一次解鎖操作,用于解除不可中斷狀態(tài)。while
循環(huán)調(diào)用
getTask()
方法從任務(wù)隊列中獲取任務(wù)(當(dāng)然,首輪循環(huán)也有可能是外部傳入的firstTask任務(wù)實例)。STOP
狀態(tài),則需要確保工作線程是中斷狀態(tài)并且進行中斷處理,否則要保證工作線程必須不是中斷狀態(tài)。Runnale#run()
方法,任務(wù)實例執(zhí)行之前和之后(包括正常執(zhí)行完畢和異常執(zhí)行情況)分別會調(diào)用鉤子方法
beforeExecute()
和
afterExecute()
。while
循環(huán)跳出意味著
runWorker()
方法結(jié)束和工作線程生命周期結(jié)束(
Worker#run()
生命周期完結(jié)),會調(diào)用
processWorkerExit()
處理工作線程退出的后續(xù)工作。接下來分析一下從任務(wù)隊列中獲取任務(wù)的getTask()
方法和處理線程退出的后續(xù)工作的方法processWorkerExit()
。
getTask()
方法是工作線程在while
死循環(huán)中獲取任務(wù)隊列中的任務(wù)對象的方法:
private Runnable getTask() {
// 記錄上一次從隊列中拉取的時候是否超時
boolean timedOut = false; // Did the last poll() time out?
// 注意這是死循環(huán)
for (;;) {
int c = ctl.get();
// Check if queue empty only if necessary.
// 第一個if:如果線程池狀態(tài)至少為SHUTDOWN,也就是rs >= SHUTDOWN(0),則需要判斷兩種情況(或邏輯):
// 1. 線程池狀態(tài)至少為STOP(1),也就是線程池正在停止,一般是調(diào)用了shutdownNow()方法
// 2. 任務(wù)隊列為空
// 如果在線程池至少為SHUTDOWN狀態(tài)并且滿足上面兩個條件之一,則工作線程數(shù)wc減去1,然后直接返回null
if (runStateAtLeast(c, SHUTDOWN)
&& (runStateAtLeast(c, STOP) || workQueue.isEmpty())) {
decrementWorkerCount();
return null;
}
// 跑到這里說明線程池還處于RUNNING狀態(tài),重新獲取一次工作線程數(shù)
int wc = workerCountOf(c);
// Are workers subject to culling?
// timed臨時變量勇于線程超時控制,決定是否需要通過poll()此帶超時的非阻塞方法進行任務(wù)隊列的任務(wù)拉取
// 1.allowCoreThreadTimeOut默認值為false,如果設(shè)置為true,則允許核心線程也能通過poll()方法從任務(wù)隊列中拉取任務(wù)
// 2.工作線程數(shù)大于核心線程數(shù)的時候,說明線程池中創(chuàng)建了額外的非核心線程,這些非核心線程一定是通過poll()方法從任務(wù)隊列中拉取任務(wù)
boolean timed = allowCoreThreadTimeOut || wc > corePoolSize;
// 第二個if:
// 1.wc > maximumPoolSize說明當(dāng)前的工作線程總數(shù)大于maximumPoolSize,說明了通過setMaximumPoolSize()方法減少了線程池容量
// 或者 2.timed && timedOut說明了線程命中了超時控制并且上一輪循環(huán)通過poll()方法從任務(wù)隊列中拉取任務(wù)為null
// 并且 3. 工作線程總數(shù)大于1或者任務(wù)隊列為空,則通過CAS把線程數(shù)減去1,同時返回null,
// CAS把線程數(shù)減去1失敗會進入下一輪循環(huán)做重試
if ((wc > maximumPoolSize || (timed && timedOut))
&& (wc > 1 || workQueue.isEmpty())) {
if (compareAndDecrementWorkerCount(c))
return null;
continue;
}
try {
// 如果timed為true,通過poll()方法做超時拉取,keepAliveTime時間內(nèi)沒有等待到有效的任務(wù),則返回null
// 如果timed為false,通過take()做阻塞拉取,會阻塞到有下一個有效的任務(wù)時候再返回(一般不會是null)
Runnable r = timed ?
workQueue.poll(keepAliveTime, TimeUnit.NANOSECONDS) :
workQueue.take();
// 這里很重要,只有非null時候才返回,null的情況下會進入下一輪循環(huán)
if (r != null)
return r;
// 跑到這里說明上一次從任務(wù)隊列中獲取到的任務(wù)為null,一般是workQueue.poll()方法超時返回null
timedOut = true;
} catch (InterruptedException retry) {
timedOut = false;
}
}
}
這個方法中,有兩處十分龐大的if
邏輯,對于第一處if
可能導(dǎo)致工作線程數(shù)減去1直接返回null
的場景有:
SHUTDOWN
,一般是調(diào)用了
shutdown()
方法,并且任務(wù)隊列為空。STOP
。對于第二處if
,邏輯有點復(fù)雜,先拆解一下:
// 工作線程總數(shù)大于maximumPoolSize,說明了通過setMaximumPoolSize()方法減少了線程池容量
boolean b1 = wc > maximumPoolSize;
// 允許線程超時同時上一輪通過poll()方法從任務(wù)隊列中拉取任務(wù)為null
boolean b2 = timed && timedOut;
// 工作線程總數(shù)大于1
boolean b3 = wc > 1;
// 任務(wù)隊列為空
boolean b4 = workQueue.isEmpty();
boolean r = (b1 || b2) && (b3 || b4);
if (r) {
if (compareAndDecrementWorkerCount(c)){
return null;
}else{
continue;
}
}
這段邏輯大多數(shù)情況下是針對非核心線程。在execute()
方法中,當(dāng)線程池總數(shù)已經(jīng)超過了corePoolSize
并且還小于maximumPoolSize
時,當(dāng)任務(wù)隊列已經(jīng)滿了的時候,會通過addWorker(task,false)
添加非核心線程。而這里的邏輯恰好類似于addWorker(task,false)
的反向操作,用于減少非核心線程,使得工作線程總數(shù)趨向于corePoolSize
。如果對于非核心線程,上一輪循環(huán)獲取任務(wù)對象為null
,這一輪循環(huán)很容易滿足timed && timedOut
為true,這個時候getTask()
返回null會導(dǎo)致Worker#runWorker()
方法跳出死循環(huán),之后執(zhí)行processWorkerExit()
方法處理后續(xù)工作,而該非核心線程對應(yīng)的Worker
則變成“游離對象”,等待被JVM回收。當(dāng)allowCoreThreadTimeOut
設(shè)置為true的時候,這里分析的非核心線程的生命周期終結(jié)邏輯同時會適用于核心線程。那么可以總結(jié)出keepAliveTime
的意義:
allowCoreThreadTimeOut
設(shè)置為true的時候,此時
keepAliveTime
表示空閑的工作線程的存活周期。keepAliveTime
表示空閑的非核心線程的存活周期。在一些特定的場景下,配置合理的keepAliveTime
能夠更好地利用線程池的工作線程資源。
processWorkerExit()
方法是為將要終結(jié)的Worker
做一次清理和數(shù)據(jù)記錄工作(因為processWorkerExit()
方法也包裹在runWorker()
方法finally
代碼塊中,其實工作線程在執(zhí)行完processWorkerExit()
方法才算真正的終結(jié))。
private void processWorkerExit(Worker w, boolean completedAbruptly) {
// 因為拋出用戶異常導(dǎo)致線程終結(jié),直接使工作線程數(shù)減1即可
// 如果沒有任何異常拋出的情況下是通過getTask()返回null引導(dǎo)線程正常跳出runWorker()方法的while死循環(huán)從而正常終結(jié),這種情況下,在getTask()中已經(jīng)把線程數(shù)減1
if (completedAbruptly) // If abrupt, then workerCount wasn't adjusted
decrementWorkerCount();
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 全局的已完成任務(wù)記錄數(shù)加上此將要終結(jié)的Worker中的已完成任務(wù)數(shù)
completedTaskCount += w.completedTasks;
// 工作線程集合中移除此將要終結(jié)的Worker
workers.remove(w);
} finally {
mainLock.unlock();
}
// 見下一小節(jié)分析,用于根據(jù)當(dāng)前線程池的狀態(tài)判斷是否需要進行線程池terminate處理
tryTerminate();
int c = ctl.get();
// 如果線程池的狀態(tài)小于STOP,也就是處于RUNNING或者SHUTDOWN狀態(tài)的前提下:
// 1.如果線程不是由于拋出用戶異常終結(jié),如果允許核心線程超時,則保持線程池中至少存在一個工作線程
// 2.如果線程由于拋出用戶異常終結(jié),或者當(dāng)前工作線程數(shù),那么直接添加一個新的非核心線程
if (runStateLessThan(c, STOP)) {
if (!completedAbruptly) {
// 如果允許核心線程超時,最小值為0,否則為corePoolSize
int min = allowCoreThreadTimeOut ? 0 : corePoolSize;
// 如果最小值為0,同時任務(wù)隊列不空,則更新最小值為1
if (min == 0 && ! workQueue.isEmpty())
min = 1;
// 工作線程數(shù)大于等于最小值,直接返回不新增非核心線程
if (workerCountOf(c) >= min)
return; // replacement not needed
}
addWorker(null, false);
}
}
代碼的后面部分區(qū)域,會判斷線程池的狀態(tài),如果線程池是RUNNING
或者SHUTDOWN
狀態(tài)的前提下,如果當(dāng)前的工作線程由于拋出用戶異常被終結(jié),那么會新創(chuàng)建一個非核心線程。如果當(dāng)前的工作線程并不是拋出用戶異常被終結(jié)(正常情況下的終結(jié)),那么會這樣處理:
allowCoreThreadTimeOut
為true,也就是允許核心線程超時的前提下,如果任務(wù)隊列空,則會通過創(chuàng)建一個非核心線程保持線程池中至少有一個工作線程。allowCoreThreadTimeOut
為false,如果工作線程總數(shù)大于
corePoolSize
則直接返回,否則創(chuàng)建一個非核心線程,也就是會趨向于保持線程池中的工作線程數(shù)量趨向于
corePoolSize
。processWorkerExit()
執(zhí)行完畢之后,意味著該工作線程的生命周期已經(jīng)完結(jié)。
每個工作線程終結(jié)的時候都會調(diào)用tryTerminate()
方法:
final void tryTerminate() {
for (;;) {
int c = ctl.get();
// 判斷線程池的狀態(tài),如果是下面三種情況下的任意一種則直接返回:
// 1.線程池處于RUNNING狀態(tài)
// 2.線程池至少為TIDYING狀態(tài),也就是TIDYING或者TERMINATED狀態(tài),意味著已經(jīng)走到了下面的步驟,線程池即將終結(jié)
// 3.線程池至少為STOP狀態(tài)并且任務(wù)隊列不為空
if (isRunning(c) ||
runStateAtLeast(c, TIDYING) ||
(runStateLessThan(c, STOP) && ! workQueue.isEmpty()))
return;
// 工作線程數(shù)不為0,則中斷工作線程集合中的第一個空閑的工作線程
if (workerCountOf(c) != 0) { // Eligible to terminate
interruptIdleWorkers(ONLY_ONE);
return;
}
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// CAS設(shè)置線程池狀態(tài)為TIDYING,如果設(shè)置成功則執(zhí)行鉤子方法terminated()
if (ctl.compareAndSet(c, ctlOf(TIDYING, 0))) {
try {
terminated();
} finally {
// 最后更新線程池狀態(tài)為TERMINATED
ctl.set(ctlOf(TERMINATED, 0));
// 喚醒阻塞在termination條件的所有線程,這個變量的await()方法在awaitTermination()中調(diào)用
termination.signalAll();
}
return;
}
} finally {
mainLock.unlock();
}
// else retry on failed CAS
}
}
// 中斷空閑的工作線程,onlyOne為true的時候,只會中斷工作線程集合中的某一個線程
private void interruptIdleWorkers(boolean onlyOne) {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
for (Worker w : workers) {
Thread t = w.thread;
// 這里判斷線程不是中斷狀態(tài)并且嘗試獲取鎖成功的時候才進行線程中斷
if (!t.isInterrupted() && w.tryLock()) {
try {
t.interrupt();
} catch (SecurityException ignore) {
} finally {
w.unlock();
}
}
// 這里跳出循環(huán),也就是只中斷集合中第一個工作線程
if (onlyOne)
break;
}
} finally {
mainLock.unlock();
}
}
這里有疑惑的地方是tryTerminate()
方法的第二個if
代碼邏輯:工作線程數(shù)不為0,則中斷工作線程集合中的第一個空閑的工作線程。方法API注釋中有這樣一段話:
?If otherwise eligible to terminate but workerCount is nonzero, interrupts an idle worker to ensure that shutdown signals propagate. 當(dāng)滿足終結(jié)線程池的條件但是工作線程數(shù)不為0,這個時候需要中斷一個空閑的工作線程去確保線程池關(guān)閉的信號得以傳播。
?
下面將會分析的shutdown()
方法中會通過interruptIdleWorkers()
中斷所有的空閑線程,這個時候有可能有非空閑的線程在執(zhí)行某個任務(wù),執(zhí)行任務(wù)完畢之后,如果它剛好是核心線程,就會在下一輪循環(huán)阻塞在任務(wù)隊列的take()
方法,如果不做額外的干預(yù),它甚至?xí)诰€程池關(guān)閉之后永久阻塞在任務(wù)隊列的take()
方法中。為了避免這種情況,每個工作線程退出的時候都會嘗試中斷工作線程集合中的某一個空閑的線程,確保所有空閑的線程都能夠正常退出。
interruptIdleWorkers()
方法中會對每一個工作線程先進行tryLock()
判斷,只有返回true
才有可能進行線程中斷。我們知道runWorker()
方法中,工作線程在每次從任務(wù)隊列中獲取到非null的任務(wù)之后,會先進行加鎖Worker#lock()
操作,這樣就能避免線程在執(zhí)行任務(wù)的過程中被中斷,保證被中斷的一定是空閑的工作線程。
線程池關(guān)閉操作有幾個相關(guān)的變體方法,先看shutdown()
:
public void shutdown() {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 權(quán)限校驗,安全策略相關(guān)判斷
checkShutdownAccess();
// 設(shè)置SHUTDOWN狀態(tài)
advanceRunState(SHUTDOWN);
// 中斷所有的空閑的工作線程
interruptIdleWorkers();
// 鉤子方法
onShutdown(); // hook for ScheduledThreadPoolExecutor
} finally {
mainLock.unlock();
}
// 調(diào)用上面分析果敢的嘗試terminate方法,使?fàn)顟B(tài)更變?yōu)門IDYING,執(zhí)行鉤子方法terminated()后,最終狀態(tài)更新為TERMINATED
tryTerminate();
}
// 升提狀態(tài)
private void advanceRunState(int targetState) {
// assert targetState == SHUTDOWN || targetState == STOP;
for (;;) {
int c = ctl.get();
// 線程池狀態(tài)至少為targetState或者CAS設(shè)置狀態(tài)為targetState則跳出循環(huán)
if (runStateAtLeast(c, targetState) ||
ctl.compareAndSet(c, ctlOf(targetState, workerCountOf(c))))
break;
}
}
// 中斷所有的空閑的工作線程
private void interruptIdleWorkers() {
interruptIdleWorkers(false);
}
接著看shutdownNow()
方法:
public List<Runnable> shutdownNow() {
List<Runnable> tasks;
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 權(quán)限校驗,安全策略相關(guān)判斷
checkShutdownAccess();
// 設(shè)置STOP狀態(tài)
advanceRunState(STOP);
// 中斷所有的工作線程
interruptWorkers();
// 清空工作隊列并且取出所有的未執(zhí)行的任務(wù)
tasks = drainQueue();
} finally {
mainLock.unlock();
}
// 調(diào)用上面分析果敢的嘗試terminate方法,使?fàn)顟B(tài)更變?yōu)門IDYING,執(zhí)行鉤子方法terminated()后,最終狀態(tài)更新為TERMINATED
tryTerminate();
return tasks;
}
// 遍歷所有的工作線程,如果state > 0(啟動狀態(tài))則進行中斷
private void interruptWorkers() {
// assert mainLock.isHeldByCurrentThread();
for (Worker w : workers)
w.interruptIfStarted();
}
shutdownNow()
方法會把線程池狀態(tài)先更變?yōu)?code>STOP,中斷AbstractQueuedSynchronizer
的state
值大于0的Worker
實例,也就是包括正在執(zhí)行任務(wù)的Worker
和空閑的Worker
),然后遍歷任務(wù)隊列,取出(移除)所有任務(wù)存放在一個列表中返回。
最后看awaitTermination()
方法:
public boolean awaitTermination(long timeout, TimeUnit unit)
throws InterruptedException {
// 轉(zhuǎn)換timeout的單位為納秒
long nanos = unit.toNanos(timeout);
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 循環(huán)等待直到線程池狀態(tài)更變?yōu)門ERMINATED,每輪循環(huán)等待nanos納秒
while (runStateLessThan(ctl.get(), TERMINATED)) {
if (nanos <= 0L)
return false;
nanos = termination.awaitNanos(nanos);
}
return true;
} finally {
mainLock.unlock();
}
}
awaitTermination()
雖然不是shutdown()
方法體系,但是它的處理邏輯就是確保調(diào)用此方法的線程會阻塞到tryTerminate()
方法成功把線程池狀態(tài)更新為TERMINATED
后再返回,可以使用在某些需要感知線程池終結(jié)時刻的場景。
有一點值得關(guān)注的是:shutdown()
方法「只會中斷空閑的工作線程」,如果工作線程正在執(zhí)行任務(wù)對象Runnable#run()
,這種情況下的工作線程不會中斷,而是等待下一輪執(zhí)行getTask()
方法的時候通過線程池狀態(tài)判斷正常終結(jié)該工作線程。
?private final ReentrantLock mainLock = new ReentrantLock(); private final Condition termination = mainLock.newCondition();
?
先看了ThreadPoolExecutor
內(nèi)部成員屬性mainLock
的引用情況:
歸結(jié)一下mainLock
的使用場景:
方法 | 主要作用 |
---|---|
tryTerminate | 保證狀態(tài)TIDYING -> TERMINATED ,鉤子方法terminated() 回調(diào)和條件變量喚醒 |
interruptIdleWorkers | 保護工作線程中斷的串行化,避免"中斷風(fēng)暴" |
addWorker | 保護工作線程集合避免并發(fā)增加工作線程、保護度量統(tǒng)計數(shù)據(jù)變更 |
processWorkerExit | 保護度量統(tǒng)計數(shù)據(jù)變更 |
shutdown 、shutdownNow 和awaitTermination | 見下文分析 |
getPoolSize 、getActiveCount 、getLargestPoolSize 、getTaskCount 和getCompletedTaskCount | 保護度量統(tǒng)計數(shù)據(jù)讀取,這些統(tǒng)計數(shù)據(jù)來一般源于Worker 集合的屬性統(tǒng)計 |
這里分析一下線程池如何通過可重入鎖和條件變量實現(xiàn)相對優(yōu)雅地關(guān)閉。先看shutdown()
方法:
public void shutdown() {
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
advanceRunState(SHUTDOWN);
interruptIdleWorkers();
onShutdown(); // hook for ScheduledThreadPoolExecutor
} finally {
mainLock.unlock();
}
tryTerminate();
}
這里shutdown()
中除了tryTerminate()
,其他它方法都是包裹在鎖里面執(zhí)行,「確保工作線程集合穩(wěn)定性以及關(guān)閉權(quán)限、確保狀態(tài)變更串行化,中斷所有工作線程并且避免工作線程"中斷風(fēng)暴"」(多次并發(fā)調(diào)用shutdown()
如果不加鎖,會反復(fù)中斷工作線程)。
public List<Runnable> shutdownNow() {
List<Runnable> tasks;
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
checkShutdownAccess();
advanceRunState(STOP);
interruptWorkers();
tasks = drainQueue(); # <--- 多了這一步
} finally {
mainLock.unlock();
}
tryTerminate();
return tasks;
}
shutdownNow()
方法其實加鎖的目的和shutdown()
差不多,不過多了一步:導(dǎo)出任務(wù)隊列中的剩余的任務(wù)實例列表。awaitTermination()
方法中使用到前面提到過的條件變量termination
:
// 條件變量必須在鎖代碼塊中執(zhí)行,和synchronized關(guān)鍵字用法差不多
public boolean awaitTermination(long timeout, TimeUnit unit)
throws InterruptedException {
long nanos = unit.toNanos(timeout);
final ReentrantLock mainLock = this.mainLock;
mainLock.lock();
try {
// 死循環(huán)確保等待執(zhí)行和狀態(tài)變更為TERMINATED
while (runStateLessThan(ctl.get(), TERMINATED)) {
if (nanos <= 0L)
return false;
nanos = termination.awaitNanos(nanos); # <-- 確保當(dāng)前調(diào)用線程阻塞等待對應(yīng)的時間或者線程池狀態(tài)變更為TERMINATED,再退出等待
}
return true;
} finally {
mainLock.unlock();
}
}
awaitTermination()
方法的核心功能是:確保當(dāng)前調(diào)用awaitTermination()
方法的線程阻塞等待對應(yīng)的時間或者線程池狀態(tài)變更為TERMINATED
,再退出等待返回結(jié)果,這樣能夠讓使用者輸入一個可以接受的等待時間進行阻塞等待,或者線程池在其他線程中被調(diào)用了shutdown()
方法狀態(tài)變更為TERMINATED
就能正常解除阻塞。awaitTermination()
方法的返回值為布爾值,true
代表線程池狀態(tài)變更為TERMINATED
或者等待了輸入時間范圍內(nèi)的時間周期被喚醒,意味則線程池正常退出,結(jié)果為false
代表等待了超過輸入時間范圍內(nèi)的時間周期,線程池的狀態(tài)依然沒有更變?yōu)?code>TERMINATED。
?線程池中的工作線程如何優(yōu)雅地退出,不導(dǎo)致當(dāng)前任務(wù)執(zhí)行丟失、任務(wù)狀態(tài)異?;蛘呷蝿?wù)持有的數(shù)據(jù)異常,是一個很值得探討的專題,以后有機會一定會分析一下這個專題。
?
reject(Runnable command)
方法很簡單:
final void reject(Runnable command) {
handler.rejectedExecution(command, this);
}
調(diào)用線程池持有的成員RejectedExecutionHandler
實例回調(diào)任務(wù)實例和當(dāng)前線程池實例。
到JDK11
為止,ThreadPoolExecutor
提供的鉤子方法沒有增加,有以下幾個:
beforeExecute(Thread t, Runnable r)
:任務(wù)對象
Runnable#run()
執(zhí)行之前觸發(fā)回調(diào)。afterExecute(Runnable r, Throwable t)
:任務(wù)對象
Runnable#run()
執(zhí)行之后(包括異常完成情況和正常完成情況)觸發(fā)回調(diào)。terminated()
:線程池關(guān)閉的時候,狀態(tài)更變?yōu)?
TIDYING
成功之后會回調(diào)此方法,執(zhí)行此方法完畢后,線程池狀態(tài)會更新為
TERMINATED
。onShutdown()
:
shutdown()
方法執(zhí)行時候會回調(diào)此方法,API注釋中提到此方法主要提供給
ScheduledThreadPoolExecutor
使用。其中onShutdown()
的方法修飾符為default
,其他三個方法的修飾符為protected
,必要時候可以自行擴展這些方法,可以實現(xiàn)監(jiān)控、基于特定時機觸發(fā)具體操作等等。
線程池本身提供了大量數(shù)據(jù)統(tǒng)計相關(guān)的方法、擴容方法、預(yù)創(chuàng)建方法等等,這些方法的源碼并不復(fù)雜,這里不做展開分析。
「核心線程相關(guān):」
getCorePoolSize()
:獲取核心線程數(shù)。setCorePoolSize()
:重新設(shè)置線程池的核心線程數(shù)。prestartCoreThread()
:預(yù)啟動一個核心線程,當(dāng)且僅當(dāng)工作線程數(shù)量小于核心線程數(shù)量。prestartAllCoreThreads()
:預(yù)啟動所有核心線程。「線程池容量相關(guān):」
getMaximumPoolSize()
:獲取線程池容量。setMaximumPoolSize()
:重新設(shè)置線程池的最大容量。「線程存活周期相關(guān):」
setKeepAliveTime()
:設(shè)置空閑工作線程的存活周期。getKeepAliveTime()
:獲取空閑工作線程的存活周期。「其他監(jiān)控統(tǒng)計相關(guān)方法:」
getTaskCount()
:獲取所有已經(jīng)被執(zhí)行的任務(wù)總數(shù)的近似值。getCompletedTaskCount()
:獲取所有已經(jīng)執(zhí)行完成的任務(wù)總數(shù)的近似值。getLargestPoolSize()
:獲取線程池的峰值線程數(shù)(最大池容量)。getActiveCount()
:獲取所有活躍線程總數(shù)(正在執(zhí)行任務(wù)的工作線程)的近似值。getPoolSize()
:獲取工作線程集合的容量(當(dāng)前線程池中的總工作線程數(shù))。「任務(wù)隊列操作相關(guān)方法:」
purge()
:移除任務(wù)隊列中所有是
Future
類型并且已經(jīng)處于
Cancelled
狀態(tài)的任務(wù)。remove()
:從任務(wù)隊列中移除指定的任務(wù)。BlockingQueue<Runnable> getQueue()
:獲取任務(wù)隊列的引用。有部分屬性值的設(shè)置有可能影響到線程池中的狀態(tài)或者工作線程的增減等,例如核心線程數(shù)改變,有可能會直接增減Worker
,這里就以ThreadPoolExecutor#setCorePoolSize()
為例:
// 設(shè)置核心線程數(shù)量
public void setCorePoolSize(int corePoolSize) {
// 輸入值不能小于0或者大于線程池的容量
if (corePoolSize < 0 || maximumPoolSize < corePoolSize)
throw new IllegalArgumentException();
// delta = 傳入核心線程數(shù)和現(xiàn)存的核心線程數(shù)的差值
int delta = corePoolSize - this.corePoolSize;
this.corePoolSize = corePoolSize;
// 如果當(dāng)前線程池工作線程的總量大于傳入核心線程數(shù),則中斷所有的工作線程
if (workerCountOf(ctl.get()) > corePoolSize)
interruptIdleWorkers();
else if (delta > 0) {
// 傳入核心線程數(shù)和現(xiàn)存的核心線程數(shù)的差值大于0,也就是核心線程擴容
// 計算傳入核心線程數(shù)和現(xiàn)存的核心線程數(shù)的差值和任務(wù)隊列中任務(wù)個數(shù)的最小值,并且添加這個最小值個數(shù)的工作線程池
// 任務(wù)隊列為空的情況下,k === 0,此時第一個條件 k--> 0就不滿足,不會進入循環(huán),那么這delta個需要創(chuàng)建的工作線程應(yīng)該是在提交新任務(wù)的時候懶創(chuàng)建
int k = Math.min(delta, workQueue.size());
while (k-- > 0 && addWorker(null, true)) {
// 如果任務(wù)隊列為空,則跳出循環(huán)
if (workQueue.isEmpty())
break;
}
}
}
?這里else if (delta > 0)后面的代碼塊中有一段描述,翻譯一下:我們并不知道真正情況下"需要"多少新的工作線程。作為一種啟發(fā)式處理方式,預(yù)先啟動足夠多的新的工作線程(直到數(shù)量為核心線程池大小)來處理隊列中當(dāng)前的任務(wù),但如果在這樣做時隊列變?yōu)榭?,則停止創(chuàng)建新的工作線程。
?
看完上述內(nèi)容,你們掌握如何從源碼上分析JUC線程池ThreadPoolExecutor的實現(xiàn)原理的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。