【ITBEAR】在近日舉行的酷+科技峰會科技創新專場活動中,RockAI公司的首席執行官劉凡平就人工智能領域的前沿話題發表了精彩演講。他圍繞“大模型與物理空間:從單體智能到群體智能”的主題,深刻剖析了當前大模型面臨的挑戰、群體智能的潛力以及未來的發展路徑。
演講伊始,劉凡平便直擊要害,指出當前大模型存在的問題。他表示,現有大模型多依賴于海量數據和強大算力進行單體推理,這種模式缺乏合理性。與人類的學習模式不同,大模型無法在現實生活中實時學習和交互。Transformer架構在存儲帶寬、訓練效果、多模態能力、實時性、能耗散熱等方面均存在明顯短板。即便是OpenAI等擁有充足算力和數據的巨頭,也面臨著算法層面的困境。Transformer架構的原作者及圖靈獎得主如楊立昆、辛頓等也對其提出了質疑,包括Scaling Law極限問題和計算資源浪費等。
在這樣的背景下,RockAI推出了首個國產化非Transformer架構——Yan架構。劉凡平介紹,Yan架構的多模態大模型在性能和效率上顯著優于同類模型,可達到Llama3 8B的水平,同時訓練效率更高,推理吞吐更大。更重要的是,它能在樹莓派等多種低算力設備上部署,這得益于其創新的MCSD和類腦激活機制。類腦激活機制模擬人腦神經元激活模式,選擇性激活部分參數,降低了算力依賴,實現了訓練與推理的同步,從而大幅提升了模型性能。
劉凡平進一步指出,通用人工智能的終局將是群體智能。他強調,群體智能在自然界中廣泛存在,人類社會的發展也離不開群體智能。而實現群體智能需要具備自主學習、人機交互和適配更多終端三個條件。RockAI在大模型領域率先提出了“群體智能”的概念,并找到了實現路徑。他們認為,實現群體智能需要經歷創新性基礎架構、多元化硬件生態、自適應智能進化和協同化群體智能四個階段。目前,RockAI正處于第三階段,并堅持在算法層面進行創新。
在談到Transformer架構時,劉凡平表示,盡管它存在諸多問題,但數據采集方式已使其具備了一定的智能涌現能力。如果將大模型引入物理世界,有望實現超指數級的智能化增長。然而,Transformer架構的大模型很難成為群體智能的單元大模型,因為其存儲帶寬限制、訓練效果不佳、多模態能力的不確定性以及實時性等問題難以解決。因此,RockAI選擇了非Transformer架構作為突破口。
劉凡平還分享了RockAI在算法層面的創新成果。他介紹,MCSD模塊將Transformer架構的“發動機”變成了電機,提升了響應性能。而類腦激活機制則實現了在處理推理和訓練時只有少部分功能被激活,從而降低了算力。這種算法層面的創新使得RockAI的模型能夠在樹莓派等低算力設備上部署,并且性能和效率均優于同類模型。
最后,劉凡平強調了自主學習能力對于大模型的重要性。他認為,自主學習能力是支撐人工智能下一步發展最關鍵的力量。而當前Transformer架構的大模型由于缺乏自主學習能力,無法在物理世界里持續進化。因此,RockAI致力于通過算法創新,讓模型具備更強的自主學習能力,從而推動人工智能向群體智能的方向發展。