9月27日,神州數碼亮相KubeCon + CloudNativeCon + Open Source Summit China 2023。在久負盛名的云原生及開源盛典上,神州數碼信創業務集團技術總監向陽朝與全球頂尖的技術專家共同探討了開源、云原生技術的最新進展,并分享了神州數碼在云原生基礎架構創新領域的最新研究與實踐進展。
云原生基礎架構的發展趨勢與挑戰
隨著數字化轉型逐漸步入“深水區”,數字化轉型路徑正從單一向多路徑、全路徑轉變,彈性敏捷的數字化轉型要求云原生應用微服務化,這就導致企業對于IT資源的需求更加彈性,以云原生或應用引擎為代表的新一代數字化技術基礎設施面臨挑戰。
在神州數碼看來,云原生基礎架構正在面臨三個層面的問題,首先是CPU性能增長緩慢,由于摩爾定律減速疊加登納德定律失效,使得芯片制程提升給芯片性能、節能帶來的收益持續降低;第二是帶寬流量增長迅速,數據爆炸式增長、網絡帶寬同步加速增長,但已到極限的單個CPU無法滿足數據和帶寬大幅增長的需求;第三是IaaS稅/ PaaS稅,算力的進一步提升受阻于數據中心日益沉重的基礎架構IaaS和PaaS所帶來的算力消耗和延時。
尤其是,伴隨著以ChatGPT為代表的應用爆炸式增長,大模型對算力的調整和部署也提出了新的要求。基于此,神州數碼認為云原生基礎架構正在從以計算(CPU)為中心向以數據(DPU)為中心轉變,服務器將專注業務計算,所有IaaS Infra任務則由IPU/DPU 處理。然而,由于DPU 架構本身還在演進,目前很難兼具高性能和靈活性。為了解決相關難題,神州數碼針對性地提出了基于DPU 的云原生服務網格加速引擎解決方案。
基于DPU 的云原生服務網格加速引擎解決方案
近年來,對于性能的擔憂成為了推廣服務網格過程中遇到的一個顯著問題。服務網格為Kubernets微服務的部署和應用提供了有力的保證和豐富的功能特性,但是也引入了計算負擔,特別是在業務復雜的情況下會對CPU造成大量的占用。
神州數碼通過分析發現,在大規模業務場景下,一些特定程序是對性能造成損耗的關鍵部分。為了優化這些問題,神州數碼嘗試通過DPU解決CPU占用的問題。神州數碼認為,不同于傳統算力,通過算力重組后,將業務邏輯、AI、分布式平臺的算力從CPU卸載到不同的平臺上,可消減CPU資源的平臺稅消耗,同時也能夠提供算力的靈活調度配給,通過充分整合各類算力資源,實現應用微服務的敏捷開發和敏捷部署。
在此基礎上,神州數碼推出的云樞系統——針對云原生部署加速的軟件和異構硬件系統,可通過軟硬件協同設計,充分發揮異構硬件各自專有能力,并對云原生服務網格進行卸載加速,進而重構數據中心基礎架構,實現對可橫向擴展的高性能云原生算力需求的支撐。這也是業內首次推出的云原生服務網格加速系統。通過部署在數據中心服務器與交換機之間,云樞系統可極大降低IaaS和PaaS所帶來的算力消耗和延時,提升數據中心整體算力。
構建零信任的DPU容器網絡
在云原生環境中,由于所有微服務都保持在同一個扁平網絡中,這也導致了重大的安全隱患。一般而言,基于服務加密的零信任被認為是解決這個問題的主要方案。所謂零信任,即不直接授權信任任何用戶、設備、服務,基于身份認證和授權重新構建訪問控制的信任基礎,從而確保身份可信、設備可信、應用可信和鏈路可信。但是,目前的技術解決方案要么需要消耗大量的CPU計算,要么無法實現服務可見性,從而造成基于DPU的零信任云原生服務網格架構存在天然難題。
通過對技術的深入研究與理解,神州數碼實現了一個零注入和服務感知的零信任容器網絡,進一步降低了DPU的應用成本。最終,神州數碼獨創性地通過軟硬件協同設計,充分發揮異構硬件各自專有能力,對云原生服務網格進行卸載加速,進而重構數據中心基礎架構。同時,神州數碼設計了硬件資源池化的可組合架構,可兼容利用用戶原有老舊設備,并極大節約用戶的投資。
面對云原生帶來的挑戰與機遇,神州數碼認為新的數字技術棧正在形成。圍繞“數云融合”架構,神州數碼將持續深耕云原生基礎架構創新領域,聚焦以云原生為核心引領的科技革命和產業革命,持續為云原生及開源生態建設和發展貢獻力量。