·“我們希望提供一個(gè)共通的語言,用于比較模型、評估風(fēng)險(xiǎn),以及衡量我們在通往AGI的道路上行進(jìn)到了什么階段。”
·最高級別的超級智能AGI系統(tǒng)可能能夠執(zhí)行原本人類完全不可能執(zhí)行的任務(wù),如通過分析大腦信號來解碼思想、通過分析大量數(shù)據(jù)來做出高質(zhì)量預(yù)測,以及與動物交流。
谷歌DeepMind聯(lián)合創(chuàng)始人謝恩·萊格(Shane Legg)帶領(lǐng)的DeepMind研究團(tuán)隊(duì)發(fā)布論文。
當(dāng)?shù)貢r(shí)間11月4日,谷歌DeepMind聯(lián)合創(chuàng)始人謝恩·萊格(Shane Legg)帶領(lǐng)的DeepMind研究團(tuán)隊(duì)發(fā)布論文(Levels of AGI: Operationalizing Progress on the Path to AGI),提出了對通用人工智能(AGI)的更清晰定義,制定了類似于自動駕駛L1-L5級別的AGI分級分類框架。
長期以來,AGI都是一個(gè)含義模糊的概念,粗略可以將其理解為“和人類差不多聰明”。研究團(tuán)隊(duì)在論文中寫道,“我們希望提供一個(gè)共通的語言,用于比較模型、評估風(fēng)險(xiǎn),以及衡量我們在通往AGI的道路上行進(jìn)到了什么階段。”
AGI六大定義原則
研究團(tuán)隊(duì)沒有用一句話概括AGI,而是提出,任何對AGI的定義都應(yīng)滿足六條原則:
關(guān)注能力,而非過程。也就是說關(guān)注AGI可以完成什么,而不是完成任務(wù)的機(jī)制。這種將關(guān)注焦點(diǎn)放在能力上的方式,使我們能夠?qū)⒁恍﹥?nèi)容排除在對AGI的要求之外,比如實(shí)現(xiàn)AGI并不意味著智能體以類似人類的方式思考或理解,或?qū)崿F(xiàn)AGI并不意味著智能體具備意識或感知(具有情感的能力),因?yàn)檫@些特質(zhì)不僅側(cè)重于過程,而且目前無法通過公認(rèn)的科學(xué)方法來衡量。
關(guān)注通用性和性能。研究團(tuán)隊(duì)認(rèn)為,通用性和性能是AGI的關(guān)鍵組成部分。
關(guān)注認(rèn)知和元認(rèn)知任務(wù)。大多數(shù)對AGI的定義側(cè)重于認(rèn)知任務(wù),可以理解為非物理任務(wù)。盡管目前機(jī)器人技術(shù)取得了一些進(jìn)展,但與非物理能力相比,AI系統(tǒng)的物理能力似乎滯后了。執(zhí)行物理任務(wù)的能力確實(shí)增加了智能體的通用性,但我們認(rèn)為這不應(yīng)被視為實(shí)現(xiàn)AGI必要的先決條件。另一方面,元認(rèn)知能力(例如學(xué)習(xí)新任務(wù)的能力或知道何時(shí)向人類請求澄清或協(xié)助的能力)是智能體實(shí)現(xiàn)通用性的關(guān)鍵先決條件。
關(guān)注潛力,而非部署。證明系統(tǒng)能夠以一定性能水平執(zhí)行一組必要任務(wù),應(yīng)該足以宣布該系統(tǒng)為AGI,在現(xiàn)實(shí)世界部署這樣的系統(tǒng),不應(yīng)該成為AGI定義的固有要求。
關(guān)注生態(tài)效度(Ecological Validity)。我們希望強(qiáng)調(diào),選擇與人們在現(xiàn)實(shí)世界(即生態(tài)有效)所重視的任務(wù)相一致的任務(wù)非常重要。
關(guān)注通往AGI的路徑,而不是單一的終點(diǎn)。研究團(tuán)隊(duì)提出AGI的五級分類,每個(gè)AGI級別都與一組明確的度量/基準(zhǔn)相關(guān)聯(lián),以及每個(gè)級別都引入已識別的風(fēng)險(xiǎn)和人機(jī)交互范式的變化,比如OpenAI提出的勞動替代定義就更符合“大師AGI”。
AGI五級分類
基于能力深度(性能)和廣度(通用性)將AGI分類為:非AI、初級、中級、專家、大師、超級智能。
基于能力深度(性能)和廣度(通用性),該研究將AGI分類為:非AI、初級、中級、專家、大師、超級智能。單個(gè)系統(tǒng)可能橫跨分類法中的不同級別,截至2023年9月,前沿語言模型如OpenAI的ChatGPT、谷歌的Bard、Meta的Llama 2在某些任務(wù)上(如短篇論文寫作、簡單編碼)表現(xiàn)出能力嫻熟的“中級”性能水平,但在大多數(shù)任務(wù)上(如數(shù)學(xué)能力、涉及事實(shí)性的任務(wù))仍處于“初級”性能水平。
研究團(tuán)隊(duì)認(rèn)為,總的來說,當(dāng)前的前沿語言模型會被視為第1級通用AI,即“初級AGI”,直到其性能水平在更廣泛的任務(wù)集上提高,滿足第2級通用AI(“能力嫻熟AGI”)的標(biāo)準(zhǔn)。
同時(shí),研究團(tuán)隊(duì)提醒道,獲得特定認(rèn)知領(lǐng)域的更強(qiáng)技能,可能對AI安全產(chǎn)生嚴(yán)重影響,如在掌握強(qiáng)大的倫理推理技能之前獲得強(qiáng)大的化學(xué)工程知識可能是一種危險(xiǎn)的組合。還要注意,性能或通用性級別之間的進(jìn)展速度可能是非線性的。獲得學(xué)習(xí)新技能的能力可能會加速通往下一個(gè)級別的進(jìn)程。
在性能和通用性的綜合方面,分級中的最高級別是ASI(人工超級智能)。研究團(tuán)隊(duì)將“超級智能”性能定義為超過100%的人類。例如,研究團(tuán)隊(duì)假定AlphaFold是分類法中的第5級“限定領(lǐng)域超人AI”,因?yàn)樗谝粋€(gè)任務(wù)(從氨基酸序列預(yù)測蛋白質(zhì)的三維結(jié)構(gòu))上的表現(xiàn)高于全球頂級科學(xué)家的水平。這個(gè)定義意味著第5級通用AI(ASI)系統(tǒng)將能夠以沒有人類能夠匹敵的水平執(zhí)行各種任務(wù)。
此外,這個(gè)框架還意味著這樣的“超人系統(tǒng)”可能能夠執(zhí)行比AGI低級別更廣泛的任務(wù),可以理解為其能夠?qū)崿F(xiàn)原本人類完全不可能執(zhí)行的任務(wù)。ASI可能具有的非人類技能可能包括神經(jīng)界面(通過分析大腦信號來解碼思想的機(jī)制)、神諭能力(通過分析大量數(shù)據(jù)來做出高質(zhì)量預(yù)測的機(jī)制),以及與動物交流的能力(通過分析它們的聲音、腦電波或肢體語言的模式等機(jī)制)。
10月底,萊格在接受科技播客采訪時(shí)表示,他仍然堅(jiān)持2011年就曾公開發(fā)表的觀點(diǎn)——研究人員有50%的可能在2028年實(shí)現(xiàn)AGI。那么這具體指的是哪一個(gè)級別?目前他還沒有明確的闡釋。
【來源:澎湃新聞】