背景
在多進(jìn)程編程中,我們都知道fork()會(huì)產(chǎn)生一個(gè)子進(jìn)程,而且子進(jìn)程就是父進(jìn)程的一個(gè)副本。按照傳統(tǒng)fork的方式,子進(jìn)程獲得父進(jìn)程數(shù)據(jù)空間、堆和棧的副本。這種實(shí)現(xiàn)方式實(shí)在過(guò)于簡(jiǎn)單,粗暴,效率低下。為什么這么說(shuō)呢?因?yàn)樵趂ork之后,往往緊接著就會(huì)跟隨exec。exec之前拷貝完全是無(wú)意義的,而且會(huì)極大的限制創(chuàng)建進(jìn)程的速度。
所以linux引入了寫(xiě)時(shí)拷貝技術(shù)(copy-on-write),簡(jiǎn)稱COW。它是一種可以推遲甚至可以免除拷貝數(shù)據(jù)的技術(shù)。fork時(shí),內(nèi)核此時(shí)并不復(fù)制整個(gè)進(jìn)程的地址空間,而是讓父進(jìn)程和子進(jìn)程共享同一個(gè)拷貝。只有在需要寫(xiě)入的時(shí)候,數(shù)據(jù)才會(huì)被復(fù)制,從而使各個(gè)進(jìn)程擁有各自的拷貝。也就是說(shuō)在此之前都是以只讀的方式訪問(wèn)。這種技術(shù)使地址空間上的頁(yè)的拷貝被推遲到真正需要寫(xiě)入的時(shí)候。例如我之前說(shuō)的情況,fork之后立即調(diào)用exec,他們就不要拷貝。
現(xiàn)在fork之后的實(shí)際開(kāi)銷就是復(fù)制進(jìn)程的頁(yè)表和子進(jìn)程創(chuàng)建唯一的進(jìn)程描述符。這是一種極大的優(yōu)化,避免了大量的無(wú)意義的拷貝。對(duì)于Linux這種強(qiáng)調(diào)快速切換的操作系統(tǒng)來(lái)說(shuō),這個(gè)優(yōu)化有著重大的意義。
注意:fork之后內(nèi)核會(huì)通過(guò)將子進(jìn)程放入到運(yùn)行隊(duì)列前面,以讓子進(jìn)程先運(yùn)行。以避免父進(jìn)程先寫(xiě)入,產(chǎn)生拷貝,而后子進(jìn)程執(zhí)行exec,導(dǎo)致因而無(wú)意義的拷貝。
詳解
在我之前的【Linux內(nèi)存管理】中我已經(jīng)講到了,每個(gè)進(jìn)程都有獨(dú)立的進(jìn)程地址空間。我們現(xiàn)在考慮一種實(shí)際情況,有一個(gè)父進(jìn)程PID1。它的虛擬地址空間大致有:代碼段,數(shù)據(jù)段,堆,棧。內(nèi)核通過(guò)頁(yè)表為他們映射了虛擬地址到物理地址,為了方便表示,就用物理地址塊表示吧。(4G地址空間)。
原始fork()
PID1 通過(guò)fork()系統(tǒng)調(diào)用創(chuàng)建了一個(gè)子進(jìn)程PID2。下圖簡(jiǎn)單的直接的表示,可以看出直接為PID2復(fù)制了PID1的地址空間數(shù)據(jù)。
COW技術(shù)
內(nèi)核只為新生成的子進(jìn)程創(chuàng)建虛擬空間結(jié)構(gòu),它們來(lái)復(fù)制于父進(jìn)程的虛擬究竟結(jié)構(gòu),但是不為這些段分配物理內(nèi)存,它們共享父進(jìn)程的物理空間,當(dāng)父子進(jìn)程中有更改相應(yīng)段的行為發(fā)生時(shí),再為子進(jìn)程相應(yīng)的段分配物理空間。
總結(jié)
通過(guò)上面的分析,相信大家對(duì)寫(xiě)時(shí)拷貝技術(shù)有了一個(gè)比較深入的認(rèn)識(shí)了。如果在本文中對(duì)這些專業(yè)術(shù)語(yǔ)不是很清楚,建議去看我之前的文章【Linux內(nèi)存管理】。