大模型的爆發,帶動了行業對于算力支撐的關注。青云科技對外發布青云AI算力調度平臺及青云 AI 算力云服務,面向算力提供新架構、新產品與新服務。
據了解,青云 AI 算力調度平臺致力于打造算力中心建設運營的新模式,實現對GPU 算力、CPU 算力、HPC 算力、多存儲、多模型資源、數據資源等多元資源的統一管理,打破網絡速度瓶頸和環境搭建復雜等制約,面向多業務場景,提供多租戶、計量、計費等豐富的運營功能,達到“像管理本地資源一樣管理 AI 基礎設施”的目標,全面提升算力中心的運營效率與平臺能力。
在青云科技總裁林源看來,AI的市場機會已經來臨,將會帶來更大的市場需求和機會。“AI和大模型來了之后,發生的變化變多了。幾乎所有的應用都需要擁抱AI技術或者被AI改造,可以看到數字化正在變成數智化。”林源強調:“新一輪的變化就是新一輪的機會。”
這也帶來了對底層算力支撐需求的增長,成為了青云的“占位點”。
整體而言,青云此次發布的青云AI算力調度平臺具備自主創新、功能完善、智能運維、成熟運營、開源開放、安全合規、中立可靠、靈活部署八大優勢,具備即刻調度擴容數萬卡資源、設置最短優先調度鏈路、支持異構平臺、提升感知作業級單卡顆粒度等能力。
圍繞靈活調度、高速并行存儲、分布式調度與管理、多區多業務資源整合、算法開發支持、混合組網、容器推理服務平臺、模型倉庫(MaaS)、AI訓練平臺九大關鍵能力,青云 AI 算力調度平臺提供多元算力統一調度的同時,具備分布式調度與管理能力,并能夠統一納管多種異構硬件設備,提供開放的應用框架,既能通過智簡運維運營幫助算力中心的建設者與運營者實現精細化管理,又能通過豐富的應用生態使能算力中心為最終用戶快速落地業務場景。
隨著大模型的爆發,AI算力需求激增,智算中心迎來了建設高峰期,但智算中心建成后的運營成為關鍵挑戰。
青云科技產品經理苗慧介紹,算力中心需要解決多元資源統一調度管理問題。例如“現在對AIGC這個領域,要對大文本、對大量行業數據進行加速,不同的資源需要統一平臺進行管理。”同時,在網絡方面需要解決優化網絡傳輸速度問題。而環境搭建的復雜性,也需要在運營層面提供相關幫助。而青云AI算力調度平臺就是根據這些難題進行優化、研發,也是青云算力調度平臺的整體目標。
因此,林源指出,青云AI算力調度平臺的目標客戶群體是現在和未來投入計算中心建設的企業。“AI算力調度平臺是計算中心運營者的關鍵工具,我們希望幫他建立從建設到運營的閉環。”
例如,青云 AI 算力調度平臺支撐運行的國家超級計算濟南中心,通過一個平臺,統一管理高性能計算、云計算、人工智能計算、數據存儲備份、工業仿真計算等資源模塊,納管異構算力,運營多元算力,服務于科研計算應用、政務云應用、智慧城市應用等多元化業務。
需要注意的是,投資建設一個平臺后產生的效益取決于平臺能力,林源介紹:“因為平臺能力越強,能支撐客戶的業務種類越多。客戶越多,盈利模式越清晰。”目前,經過3年運營后,濟南中心已經實現盈利,也從側面可以看到AI 算力調度平臺的支撐力。
面向企業用戶,此次青云也推出了青云 AI 算力云服務能夠提供算力資源、存儲資源,以及鏡像倉庫、容器推理、高速 IB 網絡等能力,讓企業快速擁有靈活智能的 AI 計算資源,滿足他們從訓練、到數據清洗、再到推理的復雜需求,承載AI 應用,支撐開發、測試、上線、運行等應用生命周期,并且能夠兼顧成本敏感與延遲敏感。
簡單來看,可以說是“以青云為主,對外運營的一個AI算力的服務。”
青云認為,在AI領域一定會有頭部玩家出現,但從形態來看,頭部玩家可能以生態而不是單獨企業的形式出現。因此,青云AI算力云服務的定位是一個開放的生態同盟。
“青云在集結這些跟我們志同道合的合作伙伴,通過‘同盟’的方式一起運營AI算力云服務。這是我們想在AI算力云里面表達的。”林源詳細說道,客戶需要完整的解決方案,所以生態是必須的;每位參與者都是專業的,彼此需要,所以彼此之間應該要開放;大家是志同道合,長期共贏的同盟。
這也直接帶出了青云在AI算力布局上的底層邏輯:青云希望通過開放的、成熟的、可運營的一個AI算力調度平臺,通過自營、合營乃至支撐第三方運營的方式,與生態同盟一起貢獻我們的AI Cloud,這是青云的邏輯和思路。
林源坦承:“青云不是什么都干,青云就干自己最擅長的AI算力調度平臺。這件事恰恰是青云差異化的價值,同時也是其他企業所需要的。”