【ITBEAR】近日,英特爾的Linux內核測試機器人發布了一項令人矚目的性能報告,指出主線Linux內核在特定測試中實現了驚人的3888.9%性能提升。
這一顯著進步得益于一項關鍵代碼提交,該提交針對內存管理進行了優化,具體為“mm, mmap”部分的修改,限制了匿名映射的透明大頁面(THP)對齊至頁面中部目錄(PMD)對齊的大小。
測試在Intel Xeon Platinum(Cooper Lake)服務器上進行,使用了“will-it-scale.per_process_ops”可擴展性測試用例來驗證性能改進。結果表明,在特定條件下,系統性能得到了極大提升。
然而,這項改動并非全然無害,它同時也導致某些工作負載的性能出現下滑。例如,在某些平臺上運行的cactusBSSN基準測試顯示,性能下降了高達600%。分析發現,這些測試創建了多個4632kB的映射,這些映射在優化前能夠合并成更大的THP支持區域,而現在卻被分割成多個與PMD邊界對齊的小區域,由此產生的間隙導致了性能損失。
面對這一問題,英特爾已經提出了解決方案,即增加一個條件判斷,要求映射的大小必須是PMD大小的整數倍,而非僅僅是達到或超過PMD大小。這樣做可以有效避免odd-sized mapping的對齊問題,使其能夠自然合并,從而恢復甚至提升性能。
此次內核性能的大幅提升和優化過程中發現的問題及解決方案,再次證明了開源社區和英特爾等企業在不斷推動Linux內核發展,以適應日益復雜的計算環境。