近日,瑞萊智慧RealAI發起設立多模態大模型公司「北京生數科技有限公司」(簡稱生數科技),以加速構建通用人工智能能力。
生數科技成立于2023年3月,將專注于打造世界領先的可控多模態通用大模型。日前,生數科技已完成近億元人民幣天使輪融資,本輪融資由螞蟻集團領投,BV百度風投、卓源資本跟投,目前估值已達1億美金。
領跑安全通用人工智能,添重磅引擎
瑞萊智慧CEO田天表示,本次瑞萊智慧發起設立生數科技具有戰略意義,將進一步完善公司大模型基礎能力,從而打造安全的通用人工智能。瑞萊智慧是清華大學人工智能研究院的孵化企業,自成立之初,就致力于研究和發展安全可控的第三代人工智能技術,建立通用AI模型能力和人工智能安全能力:通過通用人工智能模型來適應各類復雜的智能應用場景和任務;并通過人工智能安全能力,真正使人工智能造福人類整體利益。
瑞萊智慧具備國際領先的人工智能研究能力,堅持源頭創新和底層研究,在生成式人工智能等領域不斷發表世界領先科研成果。成立以來,瑞萊智慧研發團隊核心成員在人工智能領域頂會上發表論文數百篇,多次在國際測評和競賽中斬獲冠軍,獲得授權專利100余項。同時,瑞萊智慧積極推動行業規范化,累計參與30余項國家標準、行業標準制定。
2023年5月,瑞萊智慧首批入選北京市通用人工智能產業創新伙伴計劃。
目前,瑞萊智慧已形成三大平臺產品:AI模型應用平臺,基于多模態基礎大模型、垂直能力大模型及模型應用開發技術,為各類客戶提供AI理解和AI生成等應用;AI安全平臺,為通用大語言模型、人臉識別、自動駕駛等模型進行安全檢測與防護,并提供AI合成內容檢測等AIGC濫用治理服務;AI隱私計算平臺,在確保數據和隱私不泄露前提下進行AI模型訓練和推理,拓展AI數據業務應用。
憑借行業領先的人工智能技術研發和應用落地能力,瑞萊智慧面向城市治理、金融、教育科研、智能汽車等場景,已成功服務了300余家大型客戶。
自研多模態大模型,能力超越谷歌、OpenAI、英偉達同類模型
生數科技研究團隊是國內最早開展擴散概率模型基礎理論和算法研究的團隊,覆蓋基礎理論、骨干網絡、高速采樣、可控生成等全棧底層原創研發能力。團隊研究成果被OpenAI及開源擴散模型Stable Diffusion等采用作為最佳推理算法。
生數科技CEO唐家渝表示,作為當前科技領域最重要的演進方向,AIGC領域質變發展的關鍵就在于底層核心技術的持續突破,這也正是擁有深厚科研背景的生數科技所具備的核心競爭力之一。今年初,團隊開源了全球首個基于Transformer的多模態擴散大模型UniDiffuser,首次實現基于一個底層模型高質量地完成圖生文、圖文聯合生成、圖文改寫等多種生成任務。目前其文本生成圖像能力在多種測評指標和實際生成效果上,超越了全球最大開源項目stable diffusion的基礎模型。
生數科技多模態大模型在3D內容生成、視頻生成等任務中也實現全球范圍內超高水平的生成效果。例如,該模型已可在無需任何3D數據的前提下通過文本描述自動化生成業內最高質量的3D內容,生成效果已大幅領先Shap-E(OpenAI)、DreamFusion(谷歌)、Magic3D(英偉達)等主流模型水平。
以下為3D生成效果展示:
生數科技多模態大模型3D生成效果:細節、紋理、顏色展現豐富,真實感強
Google DreamFusion 3D生成效果
OpenAI SHAP-E 3D生成效果
NVIDIA Magic3D 生成效果
以下為視頻生成效果展示:根據文本描述進行視頻元素編輯,從左至右分別為原視頻、生數科技效果、Runway效果,生數在細節把控、真實度方面效果更顯著
Prompt: a girl with exquisite and rich makeup
Prompt: a Swarovski crystal swan is swimming in a river
Prompt: a red car
以下為圖像生成效果展示:
接下來,瑞萊智慧將與生數科技緊密合作,結合多模態大模型生成能力打造瑞萊智慧綜合AI行業解決方案,在垂直行業落地應用,通過可控生成能力賦能智慧營銷、多媒體內容理解分析、數字資產創建、多模態私域問答等場景,助力政務、金融、教育、汽車等各行業客戶智能化升級,創造更多價值。