2022年7月,統信軟件在繼承自由開放的開源精神基礎之上,結合當前操作系統軟硬件產業鏈的現狀,首次提出了「分層分類」的開源技術路線。
時隔一年,統信軟件自研的分層分類算法取得初步成果,并已應用于統信UOS服務器版和統信UOS云原生版等多個產品。
「分層分類」新思路,使得大家能摒棄細節,把握大局與關注核心問題,也能凝聚共識,為下一代操作系統的開發奠定堅實的理論與技術基礎。
第一
統信UOS的分層分類方案
「分層分類」體系架構的核心思想是“垂直分層、水平分類、數據驅動、算法先行”。
在IT領域中,將軟件包的關系結構化,可以有效“加速”系統構建和維護。
例如,可以由軟件包的構成和位置確定其承上啟下的作用,從而判斷更換軟件包的代價,進而為業務場景和生產環境的平滑遷移與升級提供有力的依據。
分層方案
根據軟件包依賴關系進行層級劃分,每層定義了各自的功能范圍,并向上層提供相應的接口:
內核層:包含操作系統內核和驅動程序,向下屏蔽了硬件差異。
核心層:對操作系統啟動運行和使用起關鍵作用的核心軟件。
系統層:擴展內核層、核心層功能服務,為客戶和應用提供數據和服務的軟件。
應用層:供客戶和應用使用的各類通用軟件(與各類應用場景有交集)。
分類方案
分三個維度,即形態、功能和場景:
形態:根據軟件包中的文件及其描述信息,將其分為庫、工具和服務。
功能:主要根據軟件包的描述信息,挖掘出其中的功能。
場景:以用戶的實際使用場景為依據,并根據這些場景的典型應用及其依賴關系,進行歸并。
第二
千挑萬選的BERT模型
首次提出「分層分類」技術路線后,我們做過很多嘗試:將軟件包的依賴關系組成圖后,對圖進行切割或矢量錨點定位;使用NLP算法的BERT模型,根據軟件包依賴關系進行分割……
最終,我們選擇了BERT模型方案。
BERT模型是由Google提出的自編碼語言模型,思想是計算出每個句子中每個token與其他token的關系向量,然后對關系向量進行正則化,最終得到分類概率。
第三
統信UOS的分層與分類算法
分層算法是根據軟件包的描述信息及其上下依賴關系的描述信息進行分層。
上下依賴關系分為上層依賴和下層依賴,上層依賴即其他軟件包依賴該軟件包,下層依賴即該軟件包依賴其他軟件包。
分類算法,則是根據軟件包的描述信息進行分類。
統信UOS服務器版汲取國內外主流社區技術棧優勢,融入「分層分類」的理論和實踐優勢,深入技術底層結合國內外設計標準與規范以及各類用戶業務應用需求,積極開展技術創新,全面支持國內外主流CPU架構和處理器廠商,在各種應用環境中,滿足強安全、高穩定、高性能、易維護以及泛兼容等要求,是一款構建信息化設施環境的基礎軟件產品:
強安全:
等保四級GB/T 20272-2019認證
商密二級GM/T 0028認證
全棧生態鏈支持國密
國際知名安全社區OpenSCAP官方首批支持的中國操作系統
21天推送一次補丁更新,每周進行漏洞修復推送
高穩定:
穩定版 Linux 4.19&5.10雙內核
熱補丁升級機制
LTP 7*24小時測試用例通過率超98%
長時高負荷運行,卸荷后60秒內實現系統及各應用流暢運行
高性能:
內存拷貝頁技術,拷貝性能提升超70%,滿并發優化提升10%
多種自研性能優化成果:文件讀寫性能提升4%、調度延遲減少10%、多并發鎖競爭場景性能提升5%……
相比同類產品,UnixBench等測試全面領先
易維護:
提供自研統信有易服務器遷移軟件
提供自研統信有幄自動化運維工具
提供面向場景的AI系統調優能力
泛兼容:
歷史版本兼容性>98%,提供平滑升級方案
組件模塊化設計,為用戶最大限度解決底層依賴問題
全面通過整機適配兼容性測試(多種不同型號的整機)
統信軟件服務器操作系統與云計算產線總經理孟杰表示,統信UOS的分層分類研究成果已廣泛應用于多產品、多領域,可以更好地協調產業/團隊分工、明確研發方向、維護關鍵軟件、共建共享共治開源新生態。未來,我們將繼續深耕技術方案和架構,助力中國開源操作系統角逐世界舞臺。