大家好,我是小風哥,有很多同學問能不能發下之前的文章,后續我會找一些之前閱讀量不錯的發下,本文首發于2020年8月。
一切要從CPU說起
你可能會有疑問,講多線程為什么要從CPU說起呢?原因很簡單,在這里沒有那些時髦的概念,你可以更加清晰的看清問題的本質。
CPU并不知道線程、進程之類的概念。
CPU只知道兩件事:
1. 從內存中取出指令
2. 執行指令,然后回到1
圖片
你看,在這里CPU確實是不知道什么進程、線程之類的概念。
接下來的問題就是CPU從哪里取出指令呢?答案是來自一個被稱為Program Counter(簡稱PC)的寄存器,也就是我們熟知的程序計數器,在這里大家不要把寄存器想的太神秘,你可以簡單的把寄存器理解為內存,只不過存取速度更快而已。
PC寄存器中存放的是什么呢?這里存放的是指令在內存中的地址,什么指令呢?是CPU將要執行的下一條指令。
圖片
那么是誰來設置PC寄存器中的指令地址呢?
原來PC寄存器中的地址默認是自動加1的,這當然是有道理的,因為大部分情況下CPU都是一條接一條順序執行,當遇到if、else時,這種順序執行就被打破了,CPU在執行這類指令時會根據計算結果來動態改變PC寄存器中的值,這樣CPU就可以正確的跳轉到需要執行的指令了。
聰明的你一定會問,那么PC中的初始值是怎么被設置的呢?
在回答這個問題之前我們需要知道CPU執行的指令來自哪里?是來自內存,廢話,內存中的指令是從磁盤中保存的可執行程序加載過來的,磁盤中可執行程序是編譯器生成的,編譯器又是從哪里生成的機器指令呢?答案就是我們定義的函數。
圖片
注意是函數,函數被編譯后才會形成CPU執行的指令,那么很自然的,我們該如何讓CPU執行一個函數呢?顯然我們只需要找到函數被編譯后形成的第一條指令就可以了,第一條指令就是函數入口。
現在你應該知道了吧,我們想要CPU執行一個函數,那么只需要把該函數對應的第一條機器指令的地址寫入PC寄存器就可以了,這樣我們寫的函數就開始被CPU執行起來啦。
你可能會有疑問,這和線程有什么關系呢?
從CPU到操作系統
上一小節中我們明白了CPU的工作原理,我們想讓CPU執行某個函數,那么只需要把函數對應的第一條機器執行裝入PC寄存器就可以了,這樣即使沒有操作系統我們也可以讓CPU執行程序,雖然可行但這是一個非常繁瑣的過程,我們需要:
- 在內存中找到一塊大小合適的區域裝入程序
- 找到函數入口,設置好PC寄存器讓CPU開始執行程序
這兩個步驟絕不是那么容易的事情,如果每次在執行程序時程序員自己手動實現上述兩個過程會瘋掉的,因此聰明的程序員就會想干脆直接寫個程序來自動完成上面兩個步驟吧。
圖片
機器指令需要加載到內存中執行,因此需要記錄下內存的起始地址和長度;同時要找到函數的入口地址并寫到PC寄存器中,想一想這是不是需要一個數據結構來記錄下這些信息:
struct *** {
void* start_addr;
int len;
void* start_point;
...
};
接下來就是起名字時刻。
這個數據結構總要有個名字吧,這個結構體用來記錄什么信息呢?記錄的是程序在被加載到內存中的運行狀態,程序從磁盤加載到內存跑起來叫什么好呢?干脆就叫進程(Process)好了,我們的指導原則就是一定要聽上去比較神秘,總之大家都不容易弄懂就對了,我將其稱為“弄不懂原則”。
就這樣進程誕生了。
CPU執行的第一個函數也起個名字,第一個要被執行的函數聽起來比較重要,干脆就叫mAIn函數吧。
完成上述兩個步驟的程序也要起個名字,根據“弄不懂原則”這個“簡單”的程序就叫操作系統(Operating System)好啦。
就這樣操作系統誕生了,程序員要想運行程序再也不用自己手動加載一遍了。
現在進程和操作系統都有了,一切看上去都很完美。
從單核到多核,如何充分利用多核
人類的一大特點就是生命不息折騰不止,從單核折騰到了多核。
圖片
這時,假設我們想寫一個程序并且要分利用多核該怎么辦呢?
有的同學可能會說不是有進程嗎,多開幾個進程不就可以了?聽上去似乎很有道理,但是主要存在這樣幾個問題:
- 進程是需要占用內存空間的(從上一節能看到這一點),如果多個進程基于同一個可執行程序,那么這些進程其內存區域中的內容幾乎完全相同,這顯然會造成內存的浪費
- 計算機處理的任務可能是比較復雜的,這就涉及到了進程間通信,由于各個進程處于不同的內存地址空間,進程間通信天然需要借助操作系統,這就在增大編程難度的同時也增加了系統開銷
該怎么辦呢?
從進程到線程
讓我再來仔細的想一想這個問題,所謂進程無非就是內存中的一段區域,這段區域中保存了CPU執行的機器指令以及函數運行時的堆棧信息,要想讓進程運行,就把main函數的第一條機器指令地址寫入PC寄存器,這樣進程就運行起來了。
圖片
進程的缺點在于只有一個入口函數,也就是main函數,因此進程中的機器指令只能被一個CPU執行,那么有沒有辦法讓多個CPU來執行同一個進程中的機器指令呢?
聰明的你應該能想到,既然我們可以把main函數的第一條指令地址寫入PC寄存器,那么其它函數和main函數又有什么區別呢?
答案是沒什么區別,main函數的特殊之處無非就在于是CPU執行的第一個函數,除此之外再無特別之處,我們可以把PC寄存器指向main函數,就可以把PC寄存器指向任何一個函數。
當我們把PC寄存器指向非main函數時,線程就誕生了。
圖片
至此我們解放了思想,一個進程內可以有多個入口函數,也就是說屬于同一個進程中的機器指令可以被多個CPU同時執行。
注意,這是一個和進程不同的概念,創建進程時我們需要在內存中找到一塊合適的區域以裝入進程,然后把CPU的PC寄存器指向main函數,也就是說進程中只有一個執行流。
圖片
但是現在不一樣了,多個CPU可以在同一個屋檐下(進程占用的內存區域)同時執行屬于該進程的多個入口函數,也就是說現在一個進程內可以有多個執行流了。
圖片
總是叫執行流好像有點太容易理解了,再次祭出”弄不懂原則“,起個不容易懂的名字,就叫線程吧。
這就是線程的由來。
操作系統為每個進程維護了一堆信息,用來記錄進程所處的內存空間等,這堆信息記為數據集A。
同樣的,操作系統也需要為線程維護一堆信息,用來記錄線程的入口函數或者棧信息等,這堆數據記為數據集B。
顯然數據集B要比數據A的量要少,同時不像進程,創建一個線程時無需去內存中找一段內存空間,因為線程是運行在所處進程的地址空間的,這塊地址空間在程序啟動時已經創建完畢,同時線程是程序在運行期間創建的(進程啟動后),因此當線程開始運行的時候這塊地址空間就已經存在了,線程可以直接使用。這就是為什么各種教材上提的創建線程要比創建進程快的原因(當然還有其它原因)。
值得注意的是,有了線程這個概念后,我們只需要進程開啟后創建多個線程就可以讓所有CPU都忙起來,這就是所謂高性能、高并發的根本所在。
很簡單,只需要創建出數量合適的線程就可以了。
另外值得注意的一點是,由于各個線程共享進程的內存地址空間,因此線程之間的通信無需借助操作系統,這給程序員帶來極大方便的同時也帶來了無盡的麻煩,多線程遇到的多數問題都出自于線程間通信簡直太方便了以至于非常容易出錯。出錯的根源在于CPU執行指令時根本沒有線程的概念,多線程編程面臨的互斥與同步問題需要程序員自己解決,關于互斥與同步問題限于篇幅就不詳細展開了,大部分的操作系統資料都有詳細講解。
最后需要提醒的是,雖然前面關于線程講解使用的圖中用了多個CPU,但不是說一定要有多核才能使用多線程,在單核的情況下一樣可以創建出多個線程,原因在于線程是操作系統層面的實現,和有多少個核心是沒有關系的,CPU在執行機器指令時也意識不到執行的機器指令屬于哪個線程。即使在只有一個CPU的情況下,操作系統也可以通過線程調度讓各個線程“同時”向前推進,方法就是將CPU的時間片在各個線程之間來回分配,這樣多個線程看起來就是“同時”運行了,但實際上任意時刻還是只有一個線程在運行。
線程與內存
在前面的討論中我們知道了線程和CPU的關系,也就是把CPU的PC寄存器指向線程的入口函數,這樣線程就可以運行起來了,這就是為什么我們創建線程時必須指定一個入口函數的原因。無論使用任何編程語言,創建一個線程大體相同:
// 設置線程入口函數DoSomething
thread = CreateThread(DoSomething);
// 讓線程運行起來
thread.Run();
那么線程和內存又有什么關聯呢?
我們知道函數在被執行的時產生的數據包括函數參數、局部變量、返回地址等信息,這些信息是保存在棧中的,線程這個概念還沒有出現時進程中只有一個執行流,因此只有一個棧,這個棧的棧底就是進程的入口函數,也就是main函數,假設main函數調用了funA,funcA又調用了funcB,如圖所示:
圖片
那么有了線程以后了呢?
有了線程以后一個進程中就存在多個執行入口,即同時存在多個執行流,那么只有一個執行流的進程需要一個棧來保存運行時信息,那么很顯然有多個執行流時就需要有多個棧來保存各個執行流的信息,也就是說操作系統要為每個線程在進程的地址空間中分配一個棧,即每個線程都有獨屬于自己的棧,能意識到這一點是極其關鍵的。
圖片
同時我們也可以看到,創建線程是要消耗進程內存空間的,這一點也值得注意。
線程的使用
現在有了線程的概念,那么接下來作為程序員我們該如何使用線程呢?
從生命周期的角度講,線程要處理的任務有兩類:長任務和短任務。
1,長任務,long-lived tasks
顧名思義,就是任務存活的時間很長,比如以我們常用的word為例,我們在word中編輯的文字需要保存在磁盤上,往磁盤上寫數據就是一個任務,那么這時一個比較好的方法就是專門創建一個寫磁盤的線程,該寫線程的生命周期和word進程是一樣的,只要打開word就要創建出該寫線程,當用戶關閉word時該線程才會被銷毀,這就是長任務。
這種場景非常適合創建專用的線程來處理某些特定任務,這種情況比較簡單。
有長任務,相應的就有短任務。
2,短任務,short-lived tasks
這個概念也很簡單,那就是任務的處理時間很短,比如一次網絡請求、一次數據庫查詢等,這種任務可以在短時間內快速處理完成。因此短任務多見于各種Server,像web server、database server、file server、mail server等,這也是互聯網行業的同學最常見的場景,這種場景是我們要重點討論的。
這種場景有兩個特點:一個是任務處理所需時間短;另一個是任務數量巨大。
如果讓你來處理這種類型的任務該怎么辦呢?
你可能會想,這很簡單啊,當server接收到一個請求后就創建一個線程來處理任務,處理完成后銷毀該線程即可,So easy。
這種方法通常被稱為thread-per-request,也就是說來一個請求就創建一個線程:
圖片
如果是長任務,那么這種方法可以工作的很好,但是對于大量的短任務這種方法雖然實現簡單但是有這樣幾個缺點:
1. 從前幾節我們能看到,線程是操作系統中的概念(這里不討論用戶態線程實現、協程之類),因此創建線程天然需要借助操作系統來完成,操作系統創建和銷毀線程是需要消耗時間的
2. 每個線程需要有自己獨立的棧,因此當創建大量線程時會消耗過多的內存等系統資源
這就好比你是一個工廠老板(想想都很開心有沒有),手里有很多訂單,每來一批訂單就要招一批工人,生產的產品非常簡單,工人們很快就能處理完,處理完這批訂單后就把這些千辛萬苦招過來的工人辭退掉,當有新的訂單時你再千辛萬苦的招一遍工人,干活兒5分鐘招人10小時,如果你不是勵志要讓企業倒閉的話大概是不會這么做到的,因此一個更好的策略就是招一批人后就地養著,有訂單時處理訂單,沒有訂單時大家可以閑呆著。
這就是線程池的由來。
從多線程到線程池
線程池的概念是非常簡單的,無非就是創建一批線程,之后就不再釋放了,有任務就提交給這些線程處理,因此無需頻繁的創建、銷毀線程,同時由于線程池中的線程個數通常是固定的,也不會消耗過多的內存,因此這里的思想就是復用、可控。
線程池是如何工作的
可能有的同學會問,該怎么給線程池提交任務呢?這些任務又是怎么給到線程池中線程呢?
很顯然,數據結構中的隊列天然適合這種場景,提交任務的就是生產者,消費任務的線程就是消費者,實際上這就是經典的生產者-消費者問題。
圖片
現在你應該知道為什么操作系統課程要講、面試要問這個問題了吧,因為如果你對生產者-消費者問題不理解的話,本質上你是無法正確的寫出線程池的。
限于篇幅在這里博主不打算詳細的講解生產者消費者問題,參考操作系統相關資料就能獲取答案。這里博主打算講一講一般提交給線程池的任務是什么樣子的。
一般來說提交給線程池的任務包含兩部分:1) 需要被處理的數據;2) 處理數據的函數
struct task {
void* data; // 任務所攜帶的數據
handler handle; // 處理數據的方法
}
(注意,你也可以把代碼中的struct理解成class,也就是對象。)
線程池中的線程會阻塞在隊列上,當生產者向隊列中寫入數據后,線程池中的某個線程會被喚醒,該線程從隊列中取出上述結構體(或者對象),以結構體(或者對象)中的數據為參數并調用處理函數:
while(true) { struct task = GetFromQueue(); // 從隊列中取出數據 task->handle(task->data); // 處理數據}
以上就是線程池最核心的部分。
理解這些你就能明白線程池是如何工作的了。
線程池中線程的數量
現在線程池有了,那么線程池中線程的數量該是多少呢?
在接著往下看前先自己想一想這個問題。
如果你能看到這里說明還沒有睡著。
要知道線程池的線程過少就不能充分利用CPU,線程創建的過多反而會造成系統性能下降,內存占用過多,線程切換造成的消耗等等。因此線程的數量既不能太多也不能太少,那到底該是多少呢?
回答這個問題,你需要知道線程池處理的任務有哪幾類,有的同學可能會說你不是說有兩類嗎?長任務和短任務,這個是從生命周期的角度來看的,那么從處理任務所需要的資源角度看也有兩種類型,這就是沒事兒找抽型和。。啊不,是CPU密集型和I/O密集型。
CPU密集型
所謂CPU密集型就是說處理任務不需要依賴外部I/O,比如科學計算、矩陣運算等等。在這種情況下只要線程的數量和核數基本相同就可以充分利用CPU資源。