記者/佘曉晨
2022年的最后一個月,聊天機器人模型ChatGPT的橫空出世再次攪熱了AI行業。
在和ChatGPT對話的過程中,這個AI模型不僅“上知天文,下知地理”,還可以模擬人類說話的方式和人類交互,告訴你怎么用“魯迅體”描述當下的心情。
而在驚嘆于ChatGPT強大的對話能力之前,多數行業外的人鮮少關注過其背后的公司OpenAI。
公開資料顯示,OpenAI是一個人工智能研究實驗室,總部位于舊金山。2015年,馬斯克(SpaceX創始人)、山姆·奧特曼等人聯合創辦了OpenAI,該實驗室也在2019年3月成立了用于營利的子公司。除了馬斯克,微軟也在2019年7月投資了10億美元給OpenAI。
回顧AI發展史,上一次AI機器人帶來的轟動還是來自于AlphaGo和人類之間的博弈。
2016年,由谷歌旗下DeepMind研發的人工智能程序AlphaGo以4:1擊敗韓國圍棋冠軍李世石,成為第一個戰勝圍棋世界冠軍的人工智能機器人,引發全球范圍內的關注。
當ChatGPT出現在大眾視野后,很多人將其視為DeepMind的新對手,甚至有觀點認為,其威脅到了谷歌的搜索引擎業務。這不禁讓人思考,國內外的大公司們為什么沒有做出這樣的產品?在上一波AI浪潮里,從國外的谷歌、Meta到國內的阿里、騰訊、百度,沒有一家公司不曾涉足AI研究。
GPT全稱為Generative Pre-trained Transformer,是一種基于互聯網可用數據訓練的文本生成深度學習模型,用于問答、文本摘要生成、機器翻譯、分類、代碼生成和對話AI。而在OpenAI的ChatGPT模型中,其首次采用了RLHF(從人類反饋中強化學習)方式,能夠記住與用戶之前的對話和給它的提示。
在已經做出類似成果的大公司中,谷歌、Meta和百度都在生成式AI上做出了一些產品。就在前不久,DeepMind發布了新的人工智能聊天機器人Sparrow。開發團隊表示,他們設計這款聊天機器人的目的是“與用戶交談,回答問題,并在必要的時候使用谷歌來查找證據,解釋其回復”。
不僅是谷歌,Meta也推出了人工智能聊天機器人BlenderBot。在國內,百度持續在大模型研發上投入,基于大規模知識和海量無結構數據融合學習、深度學習,其研發的文心大模型主要致力于實現視頻、歌詞、藝術畫等作品的自動生成。
但作為一家成立僅7年的公司,OpenAI在模型能力上已經處于領先地位,并持續將此作為主業發展。2018年起,OpenAI開始發布生成式預訓練語言模型GPT。2020年6月,OpenAI發布GPT-3,參數量達到了1750億,直接推動了行業內預訓練大模型的發展。
在OpenAI獲得微軟的投資后,這家公司還通過對外兩家投資鞏固自身的研發能力。OpenAI的論文指出,相對GPT-3,此次公布的ChatGPT增加了“監督微調”和“獎勵模型”,回答更加智能。
相比之下,即使是以上提到的大廠,也并未把生成式AI作為核心業務發展,更不用說其他搶占賽道卻尚未公布成果的公司。
實際上,國外的大模型開源生態建設領先于國內,而業內人士指出,大公司在大模型上的開源開放至關重要。但現階段,擺在大公司面前的難題或許是成本和商業落地的矛盾。
OpenAI CEO山姆·奧特曼近日在社交媒體稱,ChatGPT每回答一個問題的平均費用可能只有幾美分,未來還會繼續降低。但他也表示,ChatGPT背后的算力成本極高,每次訓練AI的成本高昂,因此免費測試只是暫時,未來某個時刻一定會轉為付費服務。據他透露,目前ChatGPT的用戶量已經超過百萬。
在ChatGPT引發熱潮后,多位行業人士也在近期指出,從GPT到GPT3,模型的優化主要依賴于算力的增加,不可避免地帶來成本的上升。事實上,OpenAI可能也在投入巨大成本時有過遲疑。早期,這家實驗室是AI研究方面的非營利機構,直到2019年才開始有盈利目標,成立營利性子公司。
更重要的是,在模型演進的過程中,生成式AI的商業化落地并沒有同步發展。東吳證券在研報中指出,ChatGPT無法取代搜索引擎,其本質仍偏向AIGC內容生產工具,原因是該模型仍無法很好解決提供虛假信息的問題,甚至過度猜測用戶意圖導致回答偏差較大,但其或將對搜索引擎產生一定沖擊。
以百度為例,盡管近年來文心大模型的能力不斷增強,其主要應用場景仍為AIGC業務,例如AI寫詩、AI作畫等,商業化場景仍然有待探索。
需要不斷燒錢才能到達的技術高度,加上長時間不明朗的商業前景,成為影響大廠投入并獲得產出的重要原因。他們更傾向于投資OpenAI這樣的公司而非全情投入,以保證自己承受一定范圍內的冒險。不過,ChatGPT在C端用戶中的火爆的確提振了行業的信心,在AIGC風靡全球的背景下,或許我們可以期待它打開一扇新的AI大門。