OpenAI研發的聊天機器人ChatGPT的驚人功能引發了人們對人工智能的新興趣和投資。但上周晚些時候,OpenAI的首席執行官Sam Altman警告說,構建龐大AI模型、研發生成式AI機器人的時代已經結束。
近年來,OpenAI通過采用現有的機器學習算法并將其擴展到以前無法想象的規模,在與語言一起工作的人工智能方面取得了一系列令人印象深刻的進步。GPT-4是這些項目中最新的一個,它可能是使用數萬億個文本單詞和數千個強大的計算機芯片進行訓練的,構建這一龐大的AI模型耗資超過1億美元。
但該公司的首席執行官Sam Altman表示,在AI領域進一步的進步并不是讓這類模型變得更大:
我認為我們正處于構建大型AI模型時代的末期,未來,我們會以其他方式讓這些模型變得更好。
有分析認為,Altman的這番表態意味著,在當前各科技公司都在開發和部署新AI算法、并攀比其模型規模的競賽中,出現了出人意料的轉折。自OpenAI于去年11月推出ChatGPT以來,微軟已利用底層技術在其Bing搜索引擎中添加了一個聊天機器人,谷歌也推出了一個名為Bard的聊天機器人來與之競爭。許多公司紛紛推出類似的聊天機器人以顯示自己不甘人后。
與此同時,包括Anthropic、AI21、Cohere和Character.AI在內的眾多資金充足的初創公司正在投入大量資源來構建更大的算法,以努力趕上OpenAI的技術。
同時有分析認為,Altman的這一表態可能意味著,GPT-4或許是OpenAI使模型更大并為它們提供更多數據的戰略中出現的最后一個重大進展。Altman并沒有說什么樣的研究策略或技術可能會取代它。在描述GPT-4的論文中,OpenAI估計這種擴大模型規模的策略將會有邊際效益遞減的趨勢,Altman也強調,受制于數據中心數量和建造速度,開發更大規模的AI模型也存在物理限制。
Cohere的聯合創始人Nick Frosst曾在谷歌從事AI方面的工作,他說Altman認為增加規模不會永遠奏效的想法聽起來是對的。他也認為,Transformer(GPT-4及其競爭對手的核心機器學習模型類型)的進展已經沒有什么擴展的可能性:
有很多方法可以讓Transformer變得更好、更有用,而且很多方法不涉及向模型添加參數。新的AI模型設計或架構,以及基于人類反饋的進一步調整是許多研究人員已經在探索的有前途的方向。
這些語言模型中的第一個GPT-2于2019年發布。它的最大形式有15億個參數,用于衡量其原始人工神經元之間可調節連接的數量。當時,OpenAI的研究人員發現,擴大規模可以使模型更加連貫。因此,2020年發布的GPT-3規模更大,參數數量高達1750億。該模型生成詩歌、電子郵件和其他文本的廣泛能力讓投資者眼前一亮,并引發了近期的AI熱潮。
盡管OpenAI對GPT-4的大小和內部工作原理保密,但它的一些人工智能很可能已經來自于超越規模的觀察。一種可能性是它使用了一種稱為強化學習的方法和人類反饋,用于增強ChatGPT。它涉及讓用戶判斷模型答案的質量,以引導它提供更有可能被判斷為高質量的響應。
GPT-4的非凡能力讓一些專家感到震驚,并引發了更多爭論。包括馬斯克在內的科技界領袖最近寫了一封公開信,呼吁暫停六個月的任何比GPT-4更強大的AI開發。
Altman證實他的公司目前沒有開發GPT-5:
這封信的早期版本聲稱OpenAI目前正在訓練GPT-5,我們沒有,而且一段時間內也不會。