背景
在很多IO場景中,我們經(jīng)常需要確保數(shù)據(jù)已經(jīng)安全的寫到磁盤上,以便在系統(tǒng)宕機重啟之后還能讀到這些數(shù)據(jù)。但是我們都知道,linux系統(tǒng)的IO路徑還是很復(fù)雜的,分為很多層,每一層都可能會有buffer來加速IO讀寫。同時,用戶態(tài)的應(yīng)用程序和庫函數(shù)也可能擁有自己的buffer,這又給IO路徑增加了一些復(fù)雜性。可見,要想保證數(shù)據(jù)安全的寫到磁盤上,并不是簡單調(diào)一個write/fwrite就可以搞定的。
那么要怎么做呢?很多人會想到很多辦法,比如:fflush()、fsync()、fdatasync()、sync()、open()使用O_DIRECT或O_SYNC標志等。嗯,這些手段(或者某些組合)的確可以保證數(shù)據(jù)安全的持久化,那么它們之間有什么區(qū)別呢?fflush()和fsync()有啥區(qū)別?O_DIRECT是啥意思,它可以保證數(shù)據(jù)安全的持久化嗎?O_DIRECT和O_SYNC區(qū)別什么?O_SYNC和fsync()呢?fsync能完成msync的功能嗎?本文將試圖理解、解釋這些概念的作用和區(qū)別。
Linux IO
所謂一圖勝千言,為了解析清楚這些概念的區(qū)別,我特意畫了一張圖,仔細看,應(yīng)該可以清晰的看出它們的作用和區(qū)別。
這里重點說一下O_DIRECT和O_SYNC,首先要明確的是,O_DIRECT只是說數(shù)據(jù)不會經(jīng)過page cache(一般用在用戶態(tài)自己管理buffer)而是直接提交給塊設(shè)備層,但是不會同步等待數(shù)據(jù)安全寫入磁盤之后才返回(比如數(shù)據(jù)可能還在塊層排隊或者在磁盤自己的cache中)。而O_SYNC標志,雖然數(shù)據(jù)還是會寫page cache,但是此時會采用write through的策略,并同步等待數(shù)據(jù)安全寫入磁盤后才會返回。因此如果同時使用O_DIRECT和O_SYNC,則表示數(shù)據(jù)不會經(jīng)過page cache并同步等待數(shù)據(jù)安全寫入磁盤才返回,當然這樣IO的性能會非常低下。
由于O_DIRECT會bypass page cache,因此如果有另一個進程使用普通的方式讀文件,有可能會出現(xiàn)數(shù)據(jù)不一致的現(xiàn)象,這個也需要注意。