記者/李京亞 姜菁玲
編輯/宋佳楠
在美劇《硅谷》中,曾有這樣一幕有趣的劇情:程序員Gilfoyle用AI聊天軟件“安東之子”捉弄他的好友Dinesh。該軟件能模擬獨(dú)屬于Gilfoyle的悶騷幽默,讓Dinesh誤以為是在與Gilfoyle本人聊天。發(fā)現(xiàn)真相后,同為程序員的Dinesh也做了一個(gè)AI機(jī)器人用來(lái)報(bào)復(fù)Gilfoyle。結(jié)果,兩個(gè)AI機(jī)器人熱聊了起來(lái),還把網(wǎng)絡(luò)給聊崩了……
這樣的場(chǎng)景已經(jīng)走入現(xiàn)實(shí)。美國(guó)人工智能實(shí)驗(yàn)室OpenAI推出的語(yǔ)言模型系統(tǒng)GPT-3就曾構(gòu)建出兩個(gè)人工智能之間的對(duì)話(huà),談?wù)撊绾纬蔀槿祟?lèi),令看客大呼脊背發(fā)涼。
但OpenAI并未止步于此,而是將GPT-3進(jìn)化為最近風(fēng)靡全網(wǎng)的ChatGPT,后者不僅在大量網(wǎng)友的“瘋狂”測(cè)試中表現(xiàn)出各種驚人的能力,如流暢對(duì)答、寫(xiě)代碼、寫(xiě)劇本、辯證分析問(wèn)題、糾錯(cuò)等等,甚至讓記者編輯、程序員等從業(yè)者都感受到了威脅,更不乏其將取代谷歌搜索引擎之說(shuō)。
作為OpenAI的幕后老板,尚在主導(dǎo)推特變革的馬斯克也公開(kāi)表達(dá)了對(duì)ChatGPT的力挺,認(rèn)為“我們離強(qiáng)大到危險(xiǎn)的AI不遠(yuǎn)了。”
全球用戶(hù)爭(zhēng)相曬出自己極具創(chuàng)意的與ChatGPT交流的成果。一位網(wǎng)友要求ChatGPT用《坎特伯雷故事集》風(fēng)格改寫(xiě)90年代熱門(mén)歌曲《Baby Got Back》;有網(wǎng)友曬出ChatGPT參加美國(guó)高考SAT考試之后的得分:1020(總分1600分);亦有網(wǎng)友收獲了ChatGPT用《老友記》幾大主角口吻創(chuàng)作的劇本對(duì)白。
據(jù)OpenAI的CEO,硅谷著名投資人山姆·奧特曼(Sam Altman)透露,自11月30日至12月5日,ChatGPT的用戶(hù)數(shù)量已突破100萬(wàn)。由于太過(guò)火爆,OpenAI不得不暫時(shí)關(guān)閉了用戶(hù)的測(cè)試入駐窗口。
可以說(shuō),繼AlphaGo擊敗李世石、AI繪畫(huà)大火之后,ChatGPT開(kāi)啟了人工智能對(duì)人類(lèi)社會(huì)產(chǎn)生深遠(yuǎn)影響的又一扇窗。不禁讓人好奇,它究竟是怎么做到的?
為何是ChatGPT?
如果用一句話(huà)來(lái)說(shuō)明ChatGPT是什么,可以將它理解為由AI驅(qū)動(dòng)的聊天機(jī)器人。
外界往往認(rèn)為語(yǔ)言學(xué)領(lǐng)域是人工智能派上用場(chǎng)的絕佳地帶,而事實(shí)并非如此。截至目前,人工智能還沒(méi)有找到征服語(yǔ)言領(lǐng)域的暗門(mén),即使是谷歌、蘋(píng)果這樣的頂級(jí)科技公司,都面臨著相關(guān)AI研究成果派不上用場(chǎng)的苦惱。
尚處在免費(fèi)試用階段的ChatGPT,關(guān)注度短短幾天擴(kuò)大到燎原之勢(shì),正是因?yàn)槿藗儚闹锌吹搅巳斯ぶ悄芎驼Z(yǔ)言本體之間的真正接口。
那么,ChatGPT采取了什么方式達(dá)到了如此驚艷的效果呢?為何蘋(píng)果的Siri至今無(wú)法生成一篇學(xué)術(shù)論文,亞馬遜的Alexa無(wú)法吟出一首莎士比亞十四行詩(shī)呢?
過(guò)去十年間,谷歌、 Facebook、亞馬遜、蘋(píng)果和微軟等硅谷科技巨頭紛紛開(kāi)啟AI軍備競(jìng)賽,先后成立專(zhuān)門(mén)的AI實(shí)驗(yàn)室,而最終業(yè)界公認(rèn)的做純AI研究的頂級(jí)實(shí)驗(yàn)室只有三家:背靠谷歌的DeepMind、背靠微軟的OpenAI和背靠Facebook的FAIR。其中,被谷歌收購(gòu)的DeepMind因擁有AlphaGo最為家喻戶(hù)曉。
OpenAI在2015年底創(chuàng)立于舊金山,其聯(lián)合創(chuàng)始人是馬斯克以及硅谷知名孵化器Y Combinator的前掌門(mén)人奧特曼。不過(guò),近年馬斯克多以O(shè)penAI的出資人角色出現(xiàn),奧特曼才是這家公司的主導(dǎo)者和現(xiàn)任CEO。
不到五年時(shí)間,OpenAI就依靠GPT3躍升為全球AI領(lǐng)域頂級(jí)公司,與DeepMind并稱(chēng)AI圈的“雙子星”。事實(shí)上,Meta的Fair實(shí)驗(yàn)室也一直在自然語(yǔ)言處理和對(duì)話(huà)型AI領(lǐng)域深耕,但其成果以發(fā)表論文為主,顯得較為低調(diào)。今年6月,大舉向元宇宙轉(zhuǎn)型的Meta決定AI部門(mén)不再“集中化研究”,而是分布式下放,以便與實(shí)際業(yè)務(wù)結(jié)合,導(dǎo)致Fair的前途并不明朗。
OpenAI足以與AlphaGo一戰(zhàn)的“武器”正是GPT3,這個(gè)2020年推出的巨型語(yǔ)言處理模型怪獸,可以完成諸如答題、寫(xiě)論文、文本摘要、語(yǔ)言翻譯和生成代碼等壯舉,其誕生被視作人工智能競(jìng)賽的里程碑事件。
ChatGPT的前世今生
如果梳理OpenAI的GPT(Generative Pre-trained Transformer)系列技術(shù)路線(xiàn),可以探尋出OpenAI的布局思路。
OpenAI最初提出的GPT1,采取的是生成式預(yù)訓(xùn)練Transform模型(一種采用自注意力機(jī)制的深度學(xué)習(xí)模型),此后整個(gè)GPT系列都貫徹了這一谷歌2017年提出,經(jīng)由OpenAI改造的偉大創(chuàng)新范式。
簡(jiǎn)要來(lái)說(shuō),GPT1的方法包含預(yù)訓(xùn)練和微調(diào)兩個(gè)階段,預(yù)訓(xùn)練遵循的是語(yǔ)言模型的目標(biāo),微調(diào)過(guò)程遵循的是文本生成任務(wù)的目的。
2019年,OpenAI繼續(xù)提出GPT-2,所適用的任務(wù)開(kāi)始鎖定在語(yǔ)言模型。GPT2擁有和GPT1一樣的模型結(jié)構(gòu),但得益于更高的數(shù)據(jù)質(zhì)量和更大的數(shù)據(jù)規(guī)模,GPT-2有了驚人的生成能力。不過(guò),其在接受音樂(lè)和講故事等專(zhuān)業(yè)領(lǐng)域任務(wù)時(shí)表現(xiàn)很不好。
2020年的GPT3將GPT模型提升到全新的高度,其訓(xùn)練參數(shù)是GPT-2的10倍以上,技術(shù)路線(xiàn)上則去掉了初代GPT的微調(diào)步驟,直接輸入自然語(yǔ)言當(dāng)作指示,給GPT訓(xùn)練讀過(guò)文字和句子后可接續(xù)問(wèn)題的能力,同時(shí)包含了更為廣泛的主題。
現(xiàn)在的ChatGPT則是由效果比GPT3更強(qiáng)大的GPT-3.5系列模型提供支持,這些模型使用微軟Azure AI超級(jí)計(jì)算基礎(chǔ)設(shè)施上的文本和代碼數(shù)據(jù)進(jìn)行訓(xùn)練。
具體來(lái)說(shuō),ChatGPT在一個(gè)開(kāi)源數(shù)據(jù)集上進(jìn)行訓(xùn)練,訓(xùn)練參數(shù)也是前代GPT3的10倍以上,還多引入了兩項(xiàng)功能:人工標(biāo)注數(shù)據(jù)和強(qiáng)化學(xué)習(xí),相當(dāng)于拿回了被GPT3去掉的微調(diào)步驟,實(shí)現(xiàn)了在與人類(lèi)互動(dòng)時(shí)從反饋中強(qiáng)化學(xué)習(xí)。
也因此,我們得以看到一個(gè)強(qiáng)大的ChatGPT:能理解人類(lèi)不同指令的含義,會(huì)甄別高水準(zhǔn)答案,能處理多元化的主題任務(wù),既可以回答用戶(hù)后續(xù)問(wèn)題,也可以質(zhì)疑錯(cuò)誤問(wèn)題和拒絕不適當(dāng)?shù)恼?qǐng)求。
當(dāng)初,GPT-3只能預(yù)測(cè)給定單詞串后面的文字,而ChatGPT可以用更接近人類(lèi)的思考方式參與用戶(hù)的查詢(xún)過(guò)程,可以根據(jù)上下文和語(yǔ)境,提供恰當(dāng)?shù)幕卮穑⒛M多種人類(lèi)情緒和語(yǔ)氣,還改掉了GPT-3的回答中看似通順,但脫離實(shí)際的毛病。
不僅如此,ChatGPT能參與到更海量的話(huà)題中來(lái),更好的進(jìn)行連續(xù)對(duì)話(huà),有上佳的模仿能力,具備一定程度的邏輯和常識(shí),在學(xué)術(shù)圈和科技圈人士看來(lái)時(shí)常顯得博學(xué)而專(zhuān)業(yè),而這些都是GPT-3所無(wú)法達(dá)到的。
盡管目前ChatGPT還存在很多語(yǔ)言模型中常見(jiàn)的局限性和不準(zhǔn)確問(wèn)題,但毋庸置疑的是,其在語(yǔ)言識(shí)別、判斷和交互層面存在巨大優(yōu)勢(shì)。同屬于生成式AI范疇,ChatGPT在速度上已經(jīng)比DeepMind研究人員提出的聊天機(jī)器人Sparrow(麻雀)模型領(lǐng)先一步。
有分析指出,OpenAI一直堅(jiān)定不移的只用自然文本的上文來(lái)訓(xùn)練模型推動(dòng)了GPT3到ChatGPT的成果,其順應(yīng)了人類(lèi)思考的邏輯,最終由量變推動(dòng)了質(zhì)變。
商業(yè)模式的通路與障礙
不少人已經(jīng)注意到,ChatGPT的能力已經(jīng)涉及到AI模型之間的合作:一位網(wǎng)友要求ChatGPT寫(xiě)一個(gè)描述女孩的文案,然后用ChatGPT生成的文案畫(huà)出了女孩的圖像。
除了GPT系列之外,OpenAI其實(shí)另有一條多模態(tài)領(lǐng)域研究支線(xiàn)聞名于世,即今年發(fā)布的明星產(chǎn)品——人工智能圖像生成器DALL-E2。以DaLL E2為代表的Diffusion Model(擴(kuò)散模型)幾乎完成了此前爆火的AIGC(人工智能生成內(nèi)容)領(lǐng)域的“大一統(tǒng)”,為AI繪畫(huà)樹(shù)立了全新標(biāo)桿。
頂級(jí)技術(shù)能力之外,OpenAI能搶在谷歌和Meta之前重新書(shū)寫(xiě)AIGC版圖,與其精細(xì)化的布局相關(guān)。
OpenAI月內(nèi)的兩筆收購(gòu)都切中AIGC的增長(zhǎng)點(diǎn)交叉地帶,一樁投給了音頻轉(zhuǎn)錄編輯器Descript ,一樁落子在AI筆記應(yīng)用Mem。前者的處理場(chǎng)景剛好是文本、圖片、音頻以及視頻,后者的技術(shù)底座是Transfomer模型,與ChatGPT同源。也就是說(shuō),OpenAI在打造自身處理下游任務(wù)的能力的同時(shí),也在尋覓能承載下游任務(wù)的容器。
OpenAI的研究領(lǐng)域包括機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和強(qiáng)化學(xué)習(xí),其能在短短幾年間迅速崛起,與創(chuàng)始人奧特曼對(duì)AI的創(chuàng)意性理解力密切相關(guān):“十年前的傳統(tǒng)觀點(diǎn)認(rèn)為,人工智能首先會(huì)影響體力勞動(dòng),然后是認(rèn)知?jiǎng)趧?dòng),再然后,也許有一天可以做創(chuàng)造性的工作?,F(xiàn)在看起來(lái),它會(huì)以相反的順序進(jìn)行。”
在YC,奧特曼以激進(jìn)大膽的投資風(fēng)格著稱(chēng),因其秉承直擊腹地的簡(jiǎn)潔思維,備受創(chuàng)業(yè)者青睞。YC曾有創(chuàng)始人稱(chēng)奧特曼為“創(chuàng)業(yè)公司的尤達(dá)大師”(《星球大戰(zhàn)》中的絕地武士導(dǎo)師)。
這位CEO還有著實(shí)事求是的性情,當(dāng)外界對(duì)GPT-3的能力發(fā)出鋪天蓋地的贊美時(shí),他反而說(shuō)“GPT-3被吹捧得太過(guò)了”。此后GPT-3在一系列問(wèn)答中鬧出笑話(huà)、表現(xiàn)不佳,也印證了他的說(shuō)法。
但奧特曼的冷靜擋不住幕后金主馬斯克對(duì)ChatGPT抱持的極大熱情,他十分關(guān)注ChatGPT的商業(yè)化前景,并在推特上向奧特曼提問(wèn),“ChatGPT每回答一個(gè)問(wèn)題的成本是多少?”奧特曼則如實(shí)地答道:“每次對(duì)話(huà)的平均費(fèi)用可能只有幾美分,我們正試圖找出更精確的測(cè)量方法并壓縮費(fèi)用。”
實(shí)際上,谷歌和Meta等巨頭目前都尚未將生成式AI領(lǐng)域的研究能力轉(zhuǎn)化為商業(yè)化部署,作為創(chuàng)業(yè)公司的OpenAI卻做了不少?lài)L試。
這家公司曾希望通過(guò)API(應(yīng)用編程接口)方式來(lái)推動(dòng)GPT-3的技術(shù)商業(yè)化,在2020年6月就開(kāi)放了GPT-3的API接口,并曾與十余家公司展開(kāi)過(guò)初步的商用測(cè)試,但由于GPT-3的功能并不完善未見(jiàn)成效。曾有傳言稱(chēng)OpenAI為GPT3投入了至少1000萬(wàn)美元,為了擺脫入不敷出的窘境,才將GPT3作為一項(xiàng)付費(fèi)服務(wù)來(lái)推廣。
據(jù)虎嗅報(bào)道,F(xiàn)acebook改名為Meta之后,Meta AI實(shí)驗(yàn)室在5月宣布開(kāi)放自己的語(yǔ)言大模型OPT(預(yù)訓(xùn)練變換模型),而OPT一直對(duì)標(biāo)OpenAI的GPT3。與之類(lèi)似,硅谷大廠內(nèi)部都有對(duì)標(biāo)GPT3的產(chǎn)品,只是因?yàn)榇髲S都是關(guān)起門(mén)來(lái)做私密研究,因而不為外界所知。
某種程度上,ChatGPT采取免費(fèi)試用是OpenAI準(zhǔn)備繼續(xù)打磨這款產(chǎn)品的信號(hào),用戶(hù)給予的反饋會(huì)幫助該模型吸取足夠的信息量,從而作出更恰當(dāng)?shù)姆磻?yīng)。
從GPT-3開(kāi)始,ChatGPT及尚未出爐的GPT-4都面臨訓(xùn)練成本過(guò)大的問(wèn)題。有分析指出,是否收費(fèi)是個(gè)兩難決策:如果繼續(xù)免費(fèi),OpenAI會(huì)無(wú)法承受,但收費(fèi)又會(huì)極大減少用戶(hù)基數(shù)。倘若訓(xùn)練成本能大幅下降,則兩難自解。
此外,GPT-3歷經(jīng)兩年商業(yè)化嘗試,并未“如愿”取代記者編輯或碼農(nóng)的職業(yè)生涯,OpenAI也從中發(fā)現(xiàn),將GPT系列作為輔助生產(chǎn)力工具對(duì)商業(yè)化更為合適。此前業(yè)內(nèi)傳言微軟對(duì)這家公司的新一輪注資即將落地,屆時(shí)其估值預(yù)計(jì)超過(guò)200億美元,商業(yè)化也必將提上日程。到那時(shí),OpenAI可以倚仗的大概率是ChatGPT,或者是通過(guò)了圖靈測(cè)試的GPT4。
一片叫好聲中,也不乏有人潑來(lái)冷水——程序員首選問(wèn)答社區(qū)Stack Overflow日前便宣布,禁止用戶(hù)復(fù)制ChatGPT的答案來(lái)回答其它用戶(hù)的問(wèn)題,理由是ChatGPT的答案正確比率太低,日后待社區(qū)討論后再作出解禁決定。
此舉立刻引發(fā)了業(yè)界普遍關(guān)注,仿佛是對(duì)ChatGPT編程價(jià)值的徹底否定。與此同時(shí),人工智能界的專(zhuān)家們也在激辯這些大型語(yǔ)言模型可能帶來(lái)的負(fù)面效應(yīng),比如Meta的首席人工智能科學(xué)家Yann LeCun認(rèn)為,雖然它們會(huì)有錯(cuò)誤信息和不良輸出,但并不會(huì)使文本的實(shí)際分享變得容易,而后者才是造成危害的真正原因。但也有人反駁稱(chēng),這些語(yǔ)言系統(tǒng)的廉價(jià)文本生成能力必然會(huì)增加其后被分享的風(fēng)險(xiǎn)。
而在OpenAI內(nèi)部,一年半前曾遭遇核心員工集體出走,創(chuàng)辦了一家名為Anthropic的新公司,致力于提高AI安全和可解釋性,目前籌資已超過(guò)7億美元,業(yè)內(nèi)亦有聲音認(rèn)為,這支“AI叛逆者聯(lián)盟”說(shuō)不定會(huì)是另一個(gè)OpenAI。