4月25日-26日,2023移動云大會在蘇州金雞湖國際會議中心隆重舉行。中國移動董事長楊杰發表了“云擎未來鑄重器 算啟新程繪宏圖”的主題演講,“算力網絡”成為核心關鍵詞。楊杰董事長提到:“中國移動正在打造以算為中心、網為根基,網云數智安邊端鏈(ABCDNETS)等深度融合、提供一體化服務的算力網絡。”并強調將通過匯聚產業合力,共建一流的算網產業生態。
會上,中國移動發布了COCA軟硬一體片上計算架構。其中,針對AI大模型時代下高性能計算、存儲系統面臨的挑戰和機遇,計劃以COCA為核心打造基于自研可編程DPU SoC、多元異構智能算力、高性能RDMA網絡、Diskless存儲架構引擎等技術的大模型算力基礎設施。
蘇州庫瀚信息科技有限公司作為移動云云定義存儲聯合實驗室合作伙伴受邀參加本屆移動云大會,與移動及眾多產業伙伴探討如何以高能效RISC-V存力+運力方案助力算力網絡、大模型算力基礎設施落地。
數據中心存力與運力是大算力數字經濟的基石,也是低碳經濟的重要領域。隨著海量實時數據場景的增多,如何降本增效,提高數據中心存儲與網絡的性能、效率、可靠性和安全性,同時降低其能耗和成本,成為了算力網絡落地的核心挑戰。
庫瀚科技與移動云能力中心在2021年在移動云存儲軟硬件融合設計領域簽署聯合研發協議,雙方就移動云ESSD高性能存儲網絡關鍵組件、云定制硬盤及RISCV高性能低碳存儲服務器解決方案等相關領域進行技術開發合作。
在存力方面,庫瀚于本次移動云大會首次公開實測了基于全球首款RISC-V架構PCIe 5.0 SSD主控芯片的高性能企業級SSD方案,現場實測硬件性能可達 PCIe 5.0 模式下性能達到順序讀14GB/s,順序寫>10GB/s,PCIe 4.0模式下性能為順序讀7500MB/s、順序寫6900MB/s,隨機讀1750K IOPS、穩態隨機寫600K IOPS。兩種模式下均突破庫瀚Aurora SSD主控芯片發布時的水平,實現業內頂尖的性能水準。
同時,庫瀚亦在本次移動云展會中現場展示了基于QLC NAND 和 XL-Flash Gen2兩種新型介質的SSD方案,其中XL-Flash Gen2 SSD的延遲現場實測僅為35us。
下一步,庫瀚將針對移動云ESSD存儲系統的需求,將開展更深度的軟硬件融合設計及測試調優,以滿足PCIe 5 時代對低延時、高帶寬、低功耗的存力需求。
大會現場展示的基于庫瀚Aurora的PCIe 5.0/4.0 SSD及相關存儲解決方案
在運力方面,自2021年11月起,庫瀚科技已助力移動云開展存儲網絡關鍵技術模組聯合技術攻關,目前相關云盤系統產品已進行商業化部署,形成移動云算力網絡存儲新能力。
針對AI大模型需求,庫瀚科技在本次移動云大會中,亦首次發布了大存力+大運力的系統級底座方案AI Hub™,為云計算、人工智能、媒體渲染、自動駕駛、元宇宙、BTIT等高算力、低時延的IO密集型場景提供底座式服務。
AI Hub™是庫瀚科技針對AI場景算力成本與效率痛點的底座式解決方案,基于庫瀚eSPU1.0及eSPU0.5芯片為AI算力提供更低碳高效的數據IO優化,以高能效大存力+大運力支撐國產AI芯片更高效產出算力,助力大算力可持續發展。庫瀚eSPU1.0將服務器中的智能網卡、PCIe Switch芯片、CPU的數據讀寫I/O相關功能進行融合,精簡數據搬運路徑,實現以下優勢:
1.優化系統運行效率:通過eSPU芯片實現數據流的智能調度和加速,減少數據在網絡和PCIe總線上的擁塞和延遲;
2.降低功耗:通過eSPU芯片實現數據流的硬件卸載和壓縮,減少數據在網絡和PCIe總線上的傳輸量,降低系統的能耗和散熱需求;
3.降低采購成本和使用成本:通過eSPU芯片實現智能網卡和PCIe Switch芯片的功能集成,減少系統的硬件組件和接口數量,降低系統的復雜度和故障率,節省系統的空間和成本;
庫瀚科技與移動云基于雙方對數據中心領域的共同愿景和戰略目標,旨在利用雙方在存力及運力領域的技術優勢和場景需求,共同打造基于RISC-V開源架構的高性能低碳存儲、網絡解決方案,為算力網絡等新型場景的落地提供更高效、更可靠、更靈活、更安全的基礎設施服務。同時,雙方將繼續深化合作,共同推動RISC-V架構在智算中心、算力網絡等新場景的廣泛應用和生態建設,已滿足低碳數字經濟國家戰略技術需求。