在人工智能領域,Transformer架構一直被視為關鍵技術之一,其對于推動通用大模型的發展起到了舉足輕重的作用。然而,隨著技術的不斷進步,對于Transformer架構的效率和性能提升也提出了新的挑戰。
近日,國內領先的AI企業彩云科技在北京總部舉辦了一場主題為“From Paper to App”的溝通會,CEO袁行遠在會上深入探討了通用大模型的未來進化之路,并展示了公司最新的研發成果。
彩云科技在國際機器學習領域的頂級會議ICML上發表了全新大模型論文,提出了創新的DCFormer架構。該架構通過動態組合的多頭注意力機制,顯著提升了模型的表達能力和運行效率。據袁行遠透露,基于DCFormer架構打造的模型在性能上實現了對Transformer模型的1.7-2倍提升,這一突破性的進展為人工智能的發展注入了新的活力。
隨著通用大模型的規模不斷擴大,其對于能源的需求也日益增長。袁行遠在會上指出,AI的能源困局已經成為業內共識,而改善大模型底層架構、提升運行效率是解決這一問題的關鍵路徑。彩云科技的DCFormer架構正是在這一背景下應運而生,旨在通過技術創新降低AI的能耗,推動人工智能的可持續發展。
在溝通會上,彩云科技還正式推出了首款基于DCFormer架構的通用大模型——云錦天章。袁行遠介紹稱,該模型以高雅、華美的文章為寓意,具備在虛構世界觀基礎上賦予小說人物基礎能力、高速擴寫縮寫文章等強大功能。同時,云錦天章還兼具問答、數學、編程等基礎能力,為用戶提供了更為豐富和智能的體驗。
彩云科技旗下的AI RPG平臺彩云小夢也迎來了全新升級。基于DCFormer架構的彩云小夢V3.5版本在流暢性、連貫性、記憶能力和邏輯性等方面均實現了顯著提升。新版本支持更長的前文長度和故事背景設定,使得人工智能在故事創作和對話中能夠更好地理解和記憶上下文信息,提供更加智能和個性化的服務。
袁行遠表示,彩云科技將繼續加大對DCFormer架構的研究和投入,以推動公司在人工智能領域的持續創新和領先。他相信,隨著技術的不斷進步和應用場景的不斷拓展,基于DCFormer架構的通用大模型將在未來發揮更加重要的作用。