日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

當文件系統通過submit_bio提交IO之后,請求就進入了通用塊層。通用塊層會對IO進行一些預處理的動作,其目的是為了保證請求能夠更加合理的發送到底層的磁盤設備,盡量保證性能最佳。這里面比較重要的就是IO調度模塊。大家可能都聽說過CFQ,除此之前還有DeadLine和Noop等,這些都是磁盤的調度算法。其中CFQ調度算法用的最多。

如果忽略塊設備的層疊結構和各種映射,簡化的結構大概有3層,如圖1所示。這里的3層并非都是軟件,還包含硬件。通用塊層就不用多說了,這里主要完成IO的合并和調度等操作。其下是驅動層,驅動層是硬件的驅動程序,用于將IO請求轉換為對硬件寄存器的操作(注:不同的塊設備又有差異,必然iSCSI設備是不會有寄存器操作的)。物理設備不同該驅動層的程序就不同,比如對于SAS直連的磁盤,該驅動層的程序就是SAS驅動,而如果是FC-HBA卡連接的FC-SAN,那么這個驅動層就是FC驅動(比如Qlogic的驅動)。

Linux塊設備中的IO路徑及調度策略

圖1 塊設備分層

最下面一層是設備層,設備層通常是一個硬件設備。這里的硬件種類繁多,比如SAS卡、SATA卡、FC-HBA卡或者iSCSI-HBA卡等等。但有的時候又可能并不是硬件設備,比如對于iSCSI來說,該層可能是通過軟件模擬的一個設備層,而其請求則是通過網卡發送到目標器端。

主要數據結構及流程

絕大多數程序都是由數據結構和算法2部分內容組成的,數據結構相當于程序的骨架,而算法則是程序的筋和肉。通過算法將數據結構關聯起來,從而形成一個完整的整體。人類認識問題的規律是從具體到抽象,從簡單到復雜,因此我們先從數據結構開始。理解了數據關鍵的數據結構,那我們就能更加容易的理解塊設備IO的整個邏輯。

在塊設備IO中最為關鍵的數據結構是request_queue,也就是請求隊列。該數據結構的簡圖如圖2所示,這個數據結構本身非常復雜,我們這里進行了簡化,只保留了部分關鍵的成員。如圖彩色部分是2個函數指針,分別用于接收請求和處理請求。

Linux塊設備中的IO路徑及調度策略

圖2 請求隊列數據結構

為了便于理解,我們這里舉一個例子。以NBD塊設備為例,在塊設備初始化的時候make_request_fn被初始化為blk_queue_bio,request_fn被初始化為do_nbd_request。對于SCSI塊設備而言,request_fn會被初始化為scsi_request_fn

有了上面數據結構的知識及關鍵成員初始化的結果,接下來我們就可以分析一下塊設備的整個流程的細節。塊設備請求的入口是submit_bio,經過簡單的檢查后調用

Linux塊設備中的IO路徑及調度策略

 

由上述代碼可以看出IO處理的入口函數其實是函數指針make_request_fn,而我們知道該指針實際上是函數blk_queue_bio。因此塊設備的請求會由blk_queue_bio函數進行處理。

磁盤調度策略

linux內核在設計磁盤的調度策略時提供了極大的靈活性。磁盤的調度策略以插件的注冊到內核當中,也就是用戶可以自由的選擇磁盤的調度策略。

調度算法的思想其實非常簡單,主要是通過對IO的排序、合并和批量處理來優化磁盤尋道和請求的處理時間。這里值得說明的目前的調度算法其實更多的是針對機械磁盤,因為機械磁盤磁頭定位耗時占整個IO處理時間的很大比例。當然對于SSD磁盤,調度算法也有一定的幫助,這就需要針對IO的特性具體來看了。

Linux塊設備中的IO路徑及調度策略

圖3 調度策略結構體

磁盤調度策略的結構體定義如圖3所示,各個變量的含義也是比較明確,本文不再贅述。本文主要看一下 其中elevator_ops類型的變量ops,這個變量是調度策略具體的功能實現,任何調度算法都要實現其中某些函數。

調度策略的實現就是通過這些回調函數完成的。為了理解調度策略的函數集具體做哪些事情,本文整理了一個表格,我們先從整體上看一下每個函數具體做了哪些事情。對于調度策略來說,這里的函數并非每個都要實現,下表中只有帶*的才是必須要實現的函數。

Linux塊設備中的IO路徑及調度策略

 

簡而言之,上述回調函數的功能就是判斷請求是否可以被合并、執行合并和請求下發等等操作。上述回調函數比較多,而且使用場景也比較復雜,具體使用分散在調度器的很多流程中。因此,我們很難一下子介紹清楚所有的場景。為了更加直觀的理解上述回調函數的作用,我們以Deadline調度策略為例進行簡單的介紹。

如圖4是Deadline初始化的回調函數,從圖中可以看出這里并沒有初始化所有的回調函數,而只初始化了16個回調函數中的9個。

Linux塊設備中的IO路徑及調度策略

圖4 Deadline回調函數

我們具體分析一下函數的調用場景,前文我們介紹到elevator_merge_fn函數用于查詢可以與bio合并的請求。如圖5所示為整個調用棧,入口為blk_queue_bio,這個函數我們之前介紹過,它就是調度程序的入口。該函數調用elv_merge用于查找是否有可以合并的請求,并返回。而elv_merge函數調用的正式Deadline調度器提供的回調函數。完成判斷后,該函數會根據實際情況返回請求(或者沒有找到,不返回)和可合并的方向(例如向前合并,向后合并等),后續流程就是進行具體的合并操作了。

Linux塊設備中的IO路徑及調度策略

圖5 函數調用棧

由于IO調度涉及的流程比較多,限于本文篇幅,今天就先介紹到這里。后續我們再更加深入的介紹關于IO調度的其它內容。

分享到:
標簽:路徑 Linux IO
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定