AI 大模型熱潮來襲,當下,越來越多的大模型在千行百業中落地應用。作為 AI 大模型的“底座”,AI 基礎設施承載著頂層大模型的建設,也是大模型應用落地的關鍵。在算力、數據和基礎軟件三大 AI 基礎設施中,算力是驅動大模型發展的底層動力,數據是訓練大模型的信息基礎,基礎軟件則是大模型應用落地的主要效率支撐。
6 月 30 日,九章云極DataCanvas 舉辦“New AI · New Data · New Software”主題發布會,發布了“AIFS(AI Foundation Software)”、“DataPilot”兩款新系列產品。
在發布會上,九章云極DataCanvas 董事長方磊提到,“大模型時代需要完整基礎設施升級,而不是依靠單個大模型解決所有的問題;大模型的落地將解決更困難的問題,引起更深遠的影響,而它并不比小模型更容易。”
大模型時代的 AI 技術依然需要“最后一公里”的結合。方磊指出,軟件、模型和硬件的統一優化空間巨大,是創新最活躍的地方。強大靈活的基礎軟件,開放彈性的白盒模型,精通業務的專業人才,將加速實現最后一公里的跨越。
大模型時代,AI 基礎軟件扮演什么角色?
ChatGPT 的爆火加速 AI 大模型應用落地。今年以來,越來越多的企業涌入 AI 大模型賽道,行業進入“白熱化”競爭狀態。有不少專家表示,大模型背后的技術理念早已存在多年,因此 AI 大模型并不存在技術壁壘。
“現在訓練 AI 大模型最大的挑戰主要集中在算力和數據層面”,九章云極DataCanvas 副總裁于建崗在接受 InfoQ 采訪時表示,大模型的構建本身并沒有不可逾越的基礎鴻溝,主要是基于 Transformer 進行構建,對企業而言,如何更好且更有效率地運用算力和數據才是核心痛點。“大模型對算力的需求巨大,對于中小企業而言,本身沒有足夠的 GPU 支撐其去搭建大模型。此外,大模型對數據的需求量也有一定的要求,中小企業很難獲得足夠的數據訓練大模型。”
在這一背景下,AI 基礎軟件的重要性凸顯。未來隨著算力性能逐漸同質化和標準化,數據的差異性和企業需求的個性化逐漸加大,“AI 基礎軟件”將成為模型訓練效率和算力使用效率的決定性因素。作為模型生態系統的中堅力量,AI 基礎軟件將會成為大模型應用落地的最主要的效率支撐,并通過大模型+小模型的方式,形成模型訓練新范式。
與構建傳統應用相比,構建大模型應用的基礎軟件主要解決系統和架構層優化,通過一系列工具和服務,幫助企業快速、高效構建上層 AI 應用。于建崗表示,“訓練大模型需要龐大的計算集群,如何更好的處理集群之間的通信?如何更好的進行模型切分?如何更好的利用內存和顯存?這些都需要 AI 基礎軟件來解決。AI 大模型時代對基礎軟件最大的訴求就是如何實現模型訓練優化,包括運行時推理效率的優化等等。”
模型訓練新范式:大模型+小模型
AI 基礎軟件使得 AI 技術的應用更加廣泛和高效,并為各個行業和領域的發展提供了強有力的支持。當前,企業對 AI 技術的關注度高漲,也為 AI 基礎軟件市場帶來新的增長機遇。Gartner 預測,中國的 AI 軟件市場將保持快速增長。預計未來五年,該市場的營收將從 47.67 億美元增長至 138.58 億美元,年復合增長率(CAGR)達到 28%。
“現在,越來越多的企業意識到 AI 基礎軟件的重要性。九章云極DataCanvas在基礎軟件領域耕耘多年,我們認為只要針對企業在訓練和應用大模型的過程中的痛點提供切實有效的解決方案,企業完全可以做出自己的 AI 大模型并且落地本企業的應用。”于建崗說道。
基于這種認知,九章云極DataCanvas 正式發布了人工智能應用構建基礎設施平臺 AIFS(AI Foundation Software),其覆蓋了大模型的訓練、精調、壓縮、部署、推理和監控以及小模型的全生命周期過程,為數據科學家、應用程序開發人員和業務專家提供了一套工具,使不同角色的人員可以相互協作,輕松地處理數據并使用這些數據來開發、訓練和部署任何規模的模型。
作為人工智能基礎軟件體系,AIFS 主要包括 DataCanvas Alaya 九章元識大模型、DataCanvas APS 機器學習平臺、DataCanvas BAP 面向業務自動建模平臺、開源 DAT 自動機器學習軟件、開源 YLearn 因果學習軟件等一系列全開放、高自動、高協同的軟件工具,為用戶自主構建全生命周期的“大+小”模型提供一站式支持。
“我們認為一個足夠智能的、能夠覆蓋所有小模型的大模型時代還沒有到來,比如在精準科學計算和符號推理方面大模型并不比小模型可靠,所以當前還是大小模型并存的時代。”在于建崗看來,大模型可以基于對通用知識的理解變得更廣泛,也可以通過壓縮或者知識蒸餾,部署到小模型環境中去替代一部分能力。但整體而言大小模型并存的時代還會延續一段時間。
九章云極 DataCanvas 董事長方磊也曾在一場演講中表示,盡管大模型當前表現優異,但對于各行業使用者來說,實際應用于業務場景仍然存在較高的技術和成本門檻。方磊指出,當前迎來“大+小”的新紀元,不僅僅是大模型和小模型的融合使用,大模型的小型化,或者說以大模型為底座的小型化微調,也是一種趨勢,這種方式能夠以低廉的成本解決大量的問題。
“大和小是一個相對的變化。”當前大模型的參數標準并不統一,相對于參數級,模型的效果且是否能夠支持快速迭代對于用戶實際應用來說更為重要。用戶能夠在一個白盒大模型基礎上快速地、低成本地微調和迭代出客制化的小模型,才能高效地實現豐富場景的大模型應用。這就再次點明了 AI 基礎軟件工具鏈的重要性。
值得一提的是,本次發布的 DataCanvas Alaya九章元識大模型,具有“通識+產業”系列模型矩陣、多模態大模型、優化的訓練機制和友好的開源協議管理等特點。在開源支持方面,九章元識不僅支持 Apache2.0 協議,還為用戶提供白盒模型。于建崗強調,這是公司對產品“開放性”的堅守,旨在為用戶賦予更大自由度的 AI 創新能力,以求加速實現大模型在多元業務場景中的應用。
數據處理新范式:DataPilot
在過去的十幾年,數據通常被認為是 AI 的原料、基礎要素。而大模型的出現,讓數據得到了AI的反向賦能。
利用 DataCanvas Alaya 九章元識大模型的通用文本的理解和生成能力以及在數據領域的微調優化,九章云極DataCanvas 發布了數據處理新范式——DataPilot 數據領航員,可以幫助用戶實現數據在建模全生命周期的智能化與自動化。
九章云極 DataCanvas 公司副總裁周曉凌介紹,DataPilot 的特性包括多模“向量海”數據架構,按需自動化數據集成、代碼生成、流程編排和分析計算,以及基于自然語言的數據獲取、分析和機器學習建模能力。DataPilot 能夠大幅降低數據集成、治理、建模、計算、查詢、分析、機器學習建模全鏈路的技術門檻,降低數據驅動業務發展的成本,加快數字化創新的進程。
基于“向量海”理念,DataPilot 所包含的 DataCanvas RT 實時決策中心平臺、開源 DingoDB 多模向量數據庫等各類數據軟件,讓用戶具備 AI 技術突破情況下亟需的實時、多模態的數據能力。
其中,DingoDB 作為一款開源的多模態向量數據庫,將是向量海時代的強大引擎。它結合了數據湖和向量數據庫的特性,支持存儲任何類型(鍵值、PDF、音頻、視頻等)和任何大小的數據。通過 DingoDB,用戶可以構建專屬的數據“向量海”,不論是結構化還是非結構化數據,僅通過 1 套 SQL 即可完成多模態數據的分析與科學計算。
“未來,AI 基礎軟件的發展會更加多樣化,模型之間的數據交換也會更加頻繁,也許會產生新的連接方式與生態。此外,在國家戰略與政策推動下,未來可能會出現一些相對統一化的模型,這些都會驅動 AI 基礎設施進一步升級。”周曉凌說道。