【ITBEAR】在大模型技術蓬勃發展的浪潮中,存儲系統作為支撐其高效運行的關鍵基石,正經歷著前所未有的變革。這一變革不僅體現在技術層面的迭代升級,更在于市場格局的深刻重塑。
存儲,這一在AI產業中常常被忽視卻至關重要的環節,正逐步從大模型的幕后走向臺前。它不僅需要承載海量多模態數據的存儲與管理,還要確保數據的安全可靠,同時支持快速數據讀取、并行計算、實時數據獲取以及緩存優化,以提升訓練與推理效率。隨著大模型產業的飛速發展,存儲系統的要求也水漲船高,傳統存儲方案已難以滿足當前的需求。
近日,全球權威AI基準測評組織MLCommons公布的MLPerf v1.0存儲性能基準測試結果,揭示了存儲領域的新格局。國內存儲廠商焱融科技憑借其全閃存儲產品F9000X,在帶寬、模擬GPU數量以及GPU利用率等關鍵性能指標上,取得了多項世界第一,標志著國內AI存儲技術的重大突破。
焱融科技CTO張文濤表示,大模型的發展對存儲系統在性能、穩定性和成本方面提出了更高要求。為滿足這些需求,焱融科技不斷進行產品研發和優化,最終推出了全閃F9000X這一里程碑式產品。該產品搭載了自研的高性能分布式并行文件存儲YRCloudFile,實測顯示,3節點存儲集群的性能可達到750萬IOPS和270GBps帶寬,輕松應對大規模訓練及高算力場景的挑戰。
MLPerf Storage的測試結果不僅驗證了焱融科技產品的卓越性能,更揭示了存儲系統在大模型訓練與推理中的重要性。在測試中,焱融科技是唯一一家參與了全部模型測試的國內存儲廠商,包括3D-Unet、CosmoFlow和ResNet 50等。測試規則要求存儲系統支持大規模分布式訓練集群場景,多個客戶端模擬真實數據并行的方式并發訪問存儲集群,以評估存儲系統在支持機器學習工作負載方面的性能。
測試結果顯示,在分布式訓練集群場景下,焱融存儲在所有三個模型的測試中,能夠支撐的每個計算節點平均ACC數量和存儲帶寬性能均排名第一。這意味著焱融存儲能夠高效利用GPU資源,提升模型訓練效率,同時降低成本。張文濤指出,高效的算力利用率和成本效益是存儲系統在大模型場景中的兩大關鍵點。
焱融科技的成功并非偶然。自成立以來,公司始終專注于文件存儲領域,是SDS賽道中唯一一家專注于此的企業。在私有云崛起、開源云計算管理平臺OpenStack爆火、開源容器編排引擎Kubernetes剛面世的背景下,焱融科技敏銳地洞察到了文件存儲在未來AI和高性能計算場景中的潛力。
隨著AI技術的不斷發展,文件存儲的優勢逐漸凸顯。與塊存儲和對象存儲相比,文件存儲在處理海量文件、高并發訪問、頻繁的元數據操作等AI工作負載時表現出獨特的優勢。焱融科技憑借對技術路線的深刻洞察和堅持不懈的追求,成功將文件存儲與大模型等高性能計算場景的需求相結合,推出了多款備受市場認可的存儲產品。
自2018年起,焱融科技開始大量上線大規模集群,成功服務了包括智譜AI、智源研究院、中國移動、海爾、美的在內的眾多行業領軍企業。2021年,公司進一步入局自動駕駛行業,與多家知名的自動駕駛技術公司達成合作。這些成功案例不僅驗證了焱融科技產品的卓越性能,更彰顯了其在AI存儲領域的領先地位。
如今,焱融科技已成為大模型時代存儲領域的佼佼者。其全閃F9000X產品不僅在國內市場取得了顯著成績,更在國際舞臺上展現了中國AI存儲技術的實力。未來,隨著大模型技術的不斷發展和應用場景的不斷拓展,焱融科技將繼續深耕AI存儲領域,為更多企業提供高效、穩定、低成本的存儲解決方案。