2020 年 12 月 8 日,CentOS 社區宣布 CentOS 8 將于 2021 年底停止維護,CentOS 7 將于 2024 年 6 月 30 日停止維護,未來將不會提供穩定的 CentOS 系統。當前,中國聯通集約業務系統 CentOS 使用占比超 90%,一旦停止穩定版本維護,將會對企業未來 IT 系統安全生產運營帶來嚴重影響。中國聯通軟件研究院為提前應對 CentOS 停服帶來的安全隱患,實現基礎軟件的自主可控,落實國家網絡強國的戰略要求,基于龍蜥社區技術,攜手統信軟件積極開展了存量系統的操作系統替代驗證工作,并在國內率先完成核心生產業務系統的自主可控操作系統試點替代。
本次基于龍蜥技術遷移替代實施的五大場景均是中國聯通集約化 IT 核心業務系統,涵蓋了生產、管理、服務等各個領域。得益于龍蜥社區技術多 CPU 架構的完善支持、經過大規模部署實踐的穩定性、良好的兼容性、完善的應用生態和領先的云原生技術,由聯通軟件研究院、統信軟件及社區多位技術專家成立工作小組,制定出多種備份方案確保遷移工作正常進行,攻堅克難、專項突破,僅一個多月的時間就完成第一批業務試點替換工作,替換系統運行狀態基本穩定,性能無明顯差異。
本次遷移替代難點
1、遷移替代實施中的五大場景均是中國聯通集約化 IT 核心業務系統,且每個遷移試點業務系統規模龐大,其中:
· 聯通云平臺是中國聯通全面數字化轉型中的“數字化敏捷底座”,為聯通集團和 41 個分子公司的近 300 個業務應用提供運行支持。
· 計費出賬系統承載著全國 31 省全業務支撐,出賬用戶超 4 億。
· cBSS 是中國聯通集中業務支撐系統,日服務調用量超過 30 億。
· 5G SA 智匯消息已支撐用戶 6000 萬+,日均處理消息量 96 億+。
· 新客服外呼中心基于聯通云平臺建設,是全國集中客服系統,目前支撐全國 25個省分,為聯通全國客服坐席提供外呼能力。
2、遷移業務均為在線運行的核心業務,必須要保障業務的 100% 穩定運行。3、遷移工作涉及技術組件 100 多種,涵蓋云計算、數據庫、大數據、中間件、AI、虛擬化以及多種專業化業務組件等,且各組件的配置、部署模式、版本等也各有不同,場景多。4、時間緊,任務重,試點替代工作從 8 月初開始選擇試點應用,計劃 9 月完成第一批業務試點替換工作。
遷移替代實踐
在具體實施過程中,聯通采用在業務波谷時段,按照預定操作計劃和回滾方案,開展原地遷移實施。包括:數據備份/系統備份、業務遷移、原地操作系統更換、重啟主機(主要是內核重裝或升級)、重新加載業務負載、業務核驗等步驟。最終于 9 月中旬完成試點遷移,并積累了一套遷移經驗,為面臨同樣問題的各政企單位、各行業數字化建設提供了最佳實踐。
1、整體遷移工作中,聯通云平臺、cBSS 微服務、計費出賬、客服外呼、5G SA 消息、移動辦公隨沃行都采用了云化高可用架構,以微服務容器或多進程副本模式部署,降低了對主機狀態的強依賴。
2、聯通“平臺+應用”的新型 IT 架構,有效的降低了遷移失敗和未知故障造成的系統整體不可用的風險。
3、堅持“兩步走”方式,進一步保障生產穩定和本次試點遷移順利推進。
第一步,由專項工作組針對系統基本功能、硬件兼容性、性能開展測試,完善標準化的遷移測試方案和業務預測試環境準備,由試點業務開展應用適配,主要包括應用基本功能、性能和兼容性驗證等。
第二步,聯合試點應用組梳理生產替代的詳細遷移方案、風險評估,按照分批分級,開展生產替代實施。
總結與展望
此次遷移的工作順利完成,再次驗證了基于國產操作系統解決方案可以在運營商核心場景下替代國外主流產品,具備了良好的示范性和經驗積累。在中國聯通的范例中,聯通軟件研究院展現出了強大的技術實力,一方面體現在聯通數字化敏捷底座建設的技術架構先進性,另一方面體現其在自主可控工作方面有著較大的技術積累。聯通軟件研究院作為龍蜥社區的理事成員,積極參與和貢獻龍蜥社區的建設,并提前測試最新的技術版本,打通云平臺、操作系統、芯片的技術環節,實現共享、共治,共同推動國產操作系統的開發和應用,積極迎接 CentOS 停服帶來的挑戰,這正是龍蜥社區的一項重要目標和使命。
存量 CentOS 的替換工作艱難且漫長,不僅僅需要國內操作系統廠商、社區的技術支持,也需要用戶端技術力量,是多方合作、協力的成果。除了實現 CentOS 操作系統的遷移,聯通將進一步考慮操作系統版本升級、內核版本的拉齊等技術演進目標,逐步收斂版本、跟進社區主流技術發展趨勢,解決操作系統作為底層軟件更新難題。