【ITBEAR】人工智能領域正醞釀著一場前所未有的變革,自1956年“人工智能”概念首次被提出以來,實現人類級別的智能一直是科研人員的終極目標。近年來,隨著大語言模型的崛起,通用人工智能(AGI)似乎正從遙遠的哲學構想逐漸變為觸手可及的現實。
多位業界領袖對這一變革表達了樂觀預期。馬斯克預測,AGI可能在2026年投入使用;DeepMind聯合創始人Shane Legg則認為,到2028年,人類有50%的概率開發出首個AGI;而OpenAI CEO Sam Altman更是斷言,AGI將在2025年實現,通往AGI的道路已清晰可見。然而,業界對于AGI的看法莫衷一是,有人視其為技術革命,有人則擔憂其可能帶來的潛在風險。
AGI,即通用人工智能,旨在打造具備廣泛能力的“類人智能體”,能夠像人類一樣在不同領域中自主學習、推理和解決問題。一個完整的AGI需具備三大特征:能夠完成無限任務、在場景中自主發現任務、以及擁有自主價值驅動。然而,當前的大模型如ChatGPT等,在處理任務、自主性和價值理解方面仍存在明顯不足。
大模型雖然能夠完成范圍廣泛的各類任務,并表現出一定的“元認知”能力,但它們仍局限于文本領域,無法與物理和社會環境進行互動。大模型需要人類具體定義每個任務,缺乏真正的自主性。同時,盡管ChatGPT等模型接受了大量包含人類價值觀的文本訓練,但它們并不具備理解或與人類價值保持一致的能力。
盡管如此,科技巨頭們仍將大模型視為邁向AGI的關鍵一步。與此同時,通往AGI的道路出現了兩大技術流派:一是以OpenAI為代表的Transformer學派,通過大數據、大參數、大算力,以自回歸方式走向AGI;二是以meta首席人工智能科學家Yann LeCun為代表的世界模型學派,認為自回歸的Transformer無法通往AGI,強調常識推理和基于世界模型的預測與計劃能力。
Transformer架構自2017年被介紹以來,因其顯著的語言理解和生成能力,迅速在自然語言處理領域取得廣泛應用。然而,其在理解復雜概念和常識推理方面的能力仍有限,主要依賴于從數據中學習模式,而非真正理解這些模式背后的邏輯和原因。相比之下,世界模型學派試圖通過內部模擬來預測和理解環境的動態變化,從而做出更為合理的決策。
世界模型的基本思想源自對人類和動物如何理解世界的觀察,通過構建內部表示來模擬可能的未來場景,并基于這些模擬做出決策。該模型架構由多個模塊組成,包括執行控制的配置器、理解當前狀態的感知模塊、預測的世界模型等。世界模型的最大優勢在于其環境模擬與預測的能力,使得人工智能系統可以在實際操作之前評估不同行為的后果,提高了學習效率和決策質量。
在探索AGI的道路上,Transformer架構和世界模型代表了兩種截然不同的設計哲學和目標。Transformer架構以自注意力機制為核心,適合處理序列化信息,如文本和語言;而世界模型則更側重于模擬和預測環境的動態變化,試圖通過構建內部模型來理解外部世界。這兩種方法在理解復雜系統、處理未知環境以及學習效率方面各有優劣。
未來AGI的實現可能不會完全依賴于單一技術或方法,而是需要結合Transformer架構和世界模型的優點,甚至探索新的技術和理論。例如,可以利用Transformer架構的強大語言處理能力來增強世界模型內部的環境模擬能力,或者在世界模型的框架下集成Transformer模塊來提高模型對環境變化的理解深度。這種融合將帶來新的挑戰,但也為實現真正智能、靈活且適應性強的AGI系統提供了可能。
如今,我們正站在通向AGI未來的起點上,盡管實現它的時間表尚不明確,但技術道路正逐漸清晰。AGI的進步不僅代表著技術創新,更是對未來人機交互方式的重新想象。在這場變革中,人類需要重新審視自己,以更加開放和包容的心態迎接未來的挑戰與機遇。