為什么中國沒有出現 ChatGPT?我們的差距在哪里?要投入多少資金才能與之抗衡?
“本質是專注和決心,是有沒有做到 AI First。”小冰 CEO 李笛直言,從技術層面來講,大模型的技術沒有太多的秘密,中國人的技術不亞于歐美。在本土化實踐技術、中文大模型等方面,中國甚至某些方面領先。
“AIGC(指利用人工智能技術來生成內容)背后的大模型是大資本的游戲,長期持續投入真的很貴。”資深人工智能研究專家田濤源告訴《后廠村 7 號》,在 ChatGPT 出現之前,較多企業不會選擇把錢燒在一個未知的機會上。“GPT3.5 訓練一次需要花費 300-460 萬美金,還只是算力的成本,沒算人才的成本,Open AI 一共 375 人左右,一年工資開支就要 2 億美金,AI 算力開支 5 億美元,需要雄厚的資本支撐。”
但 ChatGPT 的驚艷四座,AIGC 的技術質變,投射到廣闊的中國互聯網上,引燃了 AI 從業者的光榮與夢想、激情與野望,在噴薄、在躍動。
AI 創業者陳東記得,臨近過年的寒夜,在北京的朋友家里,他們吃著開心果、瓜子,徹夜交流,一晚上的話題幾乎都與 AIGC 和 ChatGPT 有關,雖然不少人對此還是半懂不懂,卻富有熱情。
一位投資人告訴記者,去年受大環境影響,大多 AI 創業團隊生存堪憂,年底負責 AI 賽道的投資小組還在為如何向 LP 匯報苦惱。三個月而已,AIGC 已成為 2023 年最火爆的投資賽道,沒有之一。當下這份帶有傳染性的熱鬧氣氛,讓他一掃 2022 年的垂頭喪氣。
在被 ChatGPT 驚艷的同時,國內業界也在思考:AIGC 的商業模式是什么?哪些方向存在更多機會?中國版 ChatGPT 的危與機?
最重要的是,哪些企業憑著自己的敏銳嗅覺和拼闖勁頭,抓住這波技術紅利,尋求命運的蛻變,能夠脫穎而出引領下一個時代?
(圖為張頎 AI 繪畫作品,由受訪者供圖)
中國 AIGC 生態初現:大廠搞基建,小廠做創新
當下,全世界互聯網都刮起了一陣 ChatGPT 風。這款由 OpenAI 推出的全新聊天機器人模型,不僅可以回答人類的提問,承認自己的錯誤,還能作詩、編程甚至幫助大學生完成論文。它讓馬斯克感嘆“好得嚇人”,也代表 AIGC 向全世界喊出了“芝麻開門”。
在中國,圍繞 AIGC 生長出的市場生態,已嶄露頭角。
“AIGC 并不是一個多么新鮮的概念。”陳東談到,大廠很多 2C 應用里,已經有不少內容是 AI 生成的,甚至出現過廣告對外宣傳已經在大規模使用 AIGC 技術,至少兩年前就有這個方向的創業團隊出現,并得到了一線美元基金的青睞和投資。
在他看來,AIGC 不只是大廠的機會,也將新起很多創業公司。一類公司偏底層,在新場景中孕育大模型的突破,產研類似 DALL?E、GPT 等產生很多新模型;另外是在應用層中,也會出現很多新公司,包括生成文字、圖像、視頻、數字人等等。
在趕超 ChatGPT 的巨大誘惑下,大廠率先打響了追平基礎大模型差距的“攻堅戰”。
2 月 7 日,經百度確認,百度類 ChatGPT 項目名字確定為“文心一言”,英文名 ERNIE Bot,預計 3 月份完成內測,面向公眾開放。除百度外,還有騰訊、阿里巴巴、快手、字節跳動、京東、網易、360、商湯、美圖等大廠都在 AIGC 領域有所投入,加入到這場全球新一輪 AIGC 技術競賽。
“好的人工智能大模型是非常費錢的。”在資深人工智能研究專家田濤源看來,這股預訓練大模型的風潮之下,其實是一場拼數據、拼算力、拼財力的軍備競賽長跑。
他介紹,基礎模型 GPT3.5 訓練一次需要花費 300-460 萬美金,還只是算力的成本,沒算人才的成本,Open AI 一共 375 人左右,一年工資開支就要 2 億美金,算力開支 5 億美元。“這真是很貴,而且前面那么多年是沒商業回報的,基礎模型的參數又是持續優化的過程,隨著商業化進展加速要不斷進行訓練,需要雄厚的資本支撐,確實是小公司用不起來。”
但對于基礎大模型、應用大模型未來的商業價值,行業從業者都有共識、有期待。
“AIGC 生態最值得關注的就是大模型的建設能力,這將成為 AIGC 長期價值的重要增長點。”AI 創業者“web3 天空之城城主”激動地說,“這是用短期的投入換 10 年后千倍收益的事情。”
另一面,在細分行業中,AIGC 的造富速度同樣讓人們睜大眼睛。
去年 10 月 19 日,以文字生成為主的 AIGC 項目 Jasper.Ai 完成了 1.25 億美元的 A 輪融資。完成融資后,憑借 15 億美元的估值躋身 AIGC 賽道獨角獸俱樂部。就在 Jasper.Ai 宣布融資的前一天,Stability AI 成功融得資金 1.01 億美元,投后估值達 10 億美元。
在 AIGC 的垂直技術場景中,按照模態區分,可以分為音頻生成、文本生成、圖像生成、視頻生成等細分領域,均已出現中國企業的探索身影。
文字生成:小冰、Glow、清華九歌、彩云小夢、寫作貓、瀾舟科技、元語智能等。
圖像生成:百度文心一格、盜夢師、TIAMAT、達利 AI、6pen、圖宇宙、Artflow 等。
視頻生成:抖音的剪映、快手的云剪、影譜科技、藍標分身、商湯智影、詩云科技的 Movio 等。
音頻生成:網易天音、StarX MusicX Lab、DeepMusic 等。
Game AI:rct.Ai、網易伏羲等。
數字人:啟元世界、倒映有聲等。
(網易科技梳理)
2023 年 1 月,啟元世界戰略總監王思捷接到了數通來自投資圈和產業圈朋友的電話。兩年前,他所在的公司開始大力投入數字人和 game AI 的產研,朋友們大多在問,行業環境怎么樣,變現能力如何。掛斷后,王思捷意識到有人大概會有下一步動作,“感覺已經動心了。”
從獨角獸到大廠,從使用者到投資人,從業界到學術界,AIGC 在應用層的創新引發了廣泛的關注。
有數據顯示,在用戶增長數據方面,TIAMAT 內測的用戶為 2 萬人,盜夢師日增 5 萬,上線兩個月已積累 50 萬用戶。詩云科技合伙人梁望也向記者透露,旗下視頻生成產品 Movio 上線不到一年時間,已在海外市場獲得了不錯的用戶增長數字。
資本涌入、互聯網巨頭紛紛布局的背后是 AIGC 巨大的經濟價值和市場規模。
Gartner 預測稱,到 2026 年,全球 30% 的企業機構將擁有用于數字人和元宇宙的產品與服務。麥肯錫則預測,到 2030 年全球元宇宙相關支出或達 5 萬億美元。更值得期待是,AIGC 正在逐步探索性地進入真實工業生產鏈條,應用到營銷、游戲、代碼、生命科學等多個領域。
尤其是一級市場,投資人的脈搏正在變快。
明勢資本合伙人夏令直言,2021 年年底他就和同事在梳理 AIGC 領域的機會,并且做了投資布局。AIGC 讓他感到興奮的有三點:一是,用戶在環、端到端數據驅動模型的上限極高,模型迭代 + 高質量反饋能帶來持續效果提升;二是,以抖音、小紅書為代表的內容制作再分發的邏輯有可能變為用戶與 AI 系統共同創造個性化內容的邏輯;三是,新一代的 AI 技術范式將有機會讓人類腦力勞動真正商品化。
“下一個時代已經開始。”
去年底,知春資本董事總經理謝夢暉就觀察到了這波創業的列車再一次提速。一個側面反映,“我們之前投資的相關領域被投企業,尤其是基于 ChatGPT 模型進行商業化衍生的公司,開始頻繁受邀參加各種技術和投資論壇。”
令他感到驚喜的是,這輪技術的迭代將推動創造商業的新增量。“在新的生產力基礎上,現有的生產關系必然重構,對應的經濟體系、組織模式必然會發生變革,創造力的估值將會呈指數級提升。”
AIGC 的商業模式是什么?
生于 1988 年的創業者陳東意識到自己正身處歷史之中,連續許多天大廠宣布入局 chatGPT 的消息席卷著他的注意力,創業者的朋友圈就像創投世界的溫度計,“之前搞元宇宙、web3 甚至 NFT 的都要搞 AIGC”。他和朋友們感嘆太瘋狂了,“像王慧文這種大佬,在朋友圈發布人工智能入局宣言,說 5000 萬美元,帶資入組,不在意崗位、薪資和 title,求組隊。”
雖然陳東目前還沒找到明確的方向,但已經和投資人喝上了咖啡,“他們其實也想更了解這個行業,尤其是如何商業化。”
自 AI 繪畫工具 StableDiffusion 開源以來,國內大量主打 AI 繪畫的網站和 App 如雨后春筍般涌來。AI 畫師張頎作為 AI 繪畫工具重度使用者,一些平臺內測階段就會主動找上門,讓他提看法,找 Bug。“有的甚至前端的開發人員直接過來問,要如何調整才能提升大家的付費意愿?”
(圖為張頎 AI 繪畫作品,由受訪者供圖)
產業圈和投資圈對于 AIGC,仍有一串真正嚴肅、令人如鯁在喉的問題:AIGC 的商業模式是什么?在中國像 open AI 這樣的公司在哪里?如何做成一個產品,既要普惠化,又要足夠深,足夠廣?
借鑒美國的商業化經驗,夏令大致將 AIGC 領域分為三類商業模式:一類是 OpenAI 這種專注于做大模型的公司,提供 API,做細分場景應用的公司需要去調用它的 API,按 API 去付費;第二類公司是既做大模型,又直接做垂直一體化應用的公司,比如在 AI 生成圖像很火的公司 Midjourney,第三類公司是調用第一類公司的大模型 API,基于對細分場景的深刻理解,重點開發具體場景的 AI 應用,比如 Jasper 這樣的公司。
但對于像 OpenAI 這種提供 API 的商業模式,在中國能否真正 work,還是個問號。
田濤源講,這個方向不僅在研發階段要承擔巨大的人力成本、算力開支壓力,即便真的推出效果類似 ChatGPT 的大模型,數據成本、算法調優、AI 倫理優化依然居高不下。“目前 ChatGPT 每回答一個問題,成本至少要一美分,以這樣的方式去做商業變現,面臨著高昂的成本、海量的行業優化需求、多條科技戰略路徑決策選擇。”
同時,ChatGPT 類似第一代 iPhone,上面尚沒有成功的爆款 App(例如憤怒的小鳥),它離穩定性的商業服務還存在距離,沒有跨過工業紅線。在他看來,當下還處于從實驗室基礎技術轉向產業界爆款應用服務的過程中,處于很早期。“但至少讓大家看到了基礎模型巨大的跨領域服務能力,找到了通用人工智能的一條可能成功的路。”
與此同時,在國內真正能做 AI 大模型的公司其實是極少的。
夏令觀察,但凡能做底層的模型,不管是去做語言大模型的,還是去做強化學習的,只要以技術見長,以工程化產品化的思維做底層模型的公司,融資都非常不錯,過去一兩年 VC 都要搶著投進去。“可能資本的溢價沒有像美國那么夸張,但一兩年時間做到 10 億美金估值的公司還是有一些的。”
有投資人向記者證實,目前很多創業者正在入局垂直場景,解決細分的需求,尤其是游戲 AI 和數字人生成這兩條綜合性的 AIGC 場景,已經出現趨于成熟的商業化范式。
王思捷和啟元世界團隊此刻正在經歷創業以來最繁忙的日子:由于入局較早,從算法到工程整個一套的體系積累下來的能力,已經自建出百億參數的 game AI 和數字人 AI 垂類大模型。風口降臨后,有頂級游戲制作人已經主動上門尋求合作。
他引以為傲的是,這套垂類模型的訓練和推理成本可以做到比 Open AI 同參數規模的模型低一個量級。在王思捷看來,先構建更小的垂類模型(比如百億參數、十億參數),讓數據飛輪和模型訓練能夠很好結合,垂類模型在某些領域可能比 open AI 的效果更好成本更低。“這種想象能力是在中國更能跑通的。”
小冰 CEO 李笛則直言 AIGC 商業回報賽道最大的是數字人,“它的客單價明顯會更高,我們做過終端內容的生成,感覺這是個菜市場般的內容市場,單價非常低,直到我們將 AI 生成能力捆綁到數字人身上,平均客單價迅速從 20 萬提高到了 300 萬,當然你的成品質量要足夠高。”
但對于只懂用 API 調用生成內容的創業團隊,參與本次采訪的受訪者大多表示,“價值有限。”
李笛試圖放出一個警惕信號,奉勸想要進入 AIGC 賽道的創業者,要謹慎使用大廠提供的可調用接口,盡可能自建垂類模型。
“API 調用的商業模式掙不到錢,所以即便是為了發展,大廠也一定會跳進去,去做生態鏈上面其他生態類企業的事情,首當其沖就是直截了當應用他們的技術來提供服務的人。”他判斷最終的結果,“你要做起來一定會被吃掉,骨頭都不剩。”
中美差距:不在技術,在專注
在被 ChatGPT 驚艷的同時,國內業界也在反思:為什么中國沒有出現 ChatGPT?
事實上,此前不乏有國內公司雄心勃勃想登上中文版 ChatGPT 的“王座”。但在可能的未來和確鑿的現實面前,在巨額投入和業績報表的沖突面前,選擇了猶豫不前。
“大模型的技術沒有太多的秘密。”李笛直言,在 ChatGPT 出現前,小冰從 2017 年就開始做 AIGC 相關的東西,從技術層面來講,中國人的技術不亞于歐美。在本土化實踐技術、中文大模型等方面,中國甚至某些方面領先。
文心一格相關負責人也告訴記者,和海外的同類型產品相比,在跨模態生成能力、中文知識與理解,以及繪圖效率等方面,其實公司在技術層面均存在著優勢。他舉例,“中文知識與理解方面,文心一格對中文文本、文化和風格就能有更好的理解與刻畫能力。”
事實上,國內,一群最勇敢、懷抱最狂野夢想的年輕創業者,已經帶著自己的 AI 生成產品挑戰海外市場,與世界一流的上市公司對標產品能力。
“我們現在主要的產品叫 Movio,是一款 AI 視頻創作工具,主要面向全球市場,從歐美出發。”詩云科技合伙人梁望向記者介紹選擇出海的原因,“一是歐美地區對于 SaaS 的接受度、付費意愿和市場體量高很多,二是他們的期待和標準也會高很多,就像參與 SaaS 領域世界上最頂級的賽事,我們有意選擇最高標準的市場,接受最嚴格的用戶的眼光,以此證明中國團隊也能做出全球領先的 SaaS 產品。”
“AIGC 這件事要真正落地,門檻不僅僅是技術水平,更重要的是從 AI 到用戶到數據,再到產品體驗能夠循環起來的一個飛輪。”從目前拿到手的海外用戶反饋,他判斷,“在這個方向上,我們現在技術和產品體驗上,都是比較領先的。
對比海內外的團隊,梁望最大的感受是大家對于創新的理解和投入度存在差異。例如,面對那些可能短期甚至中期內都看不到回報的創新,團隊是否仍然擁有無論如何都要去做出來的精神和決心。
作為企業的一把手,李笛也深刻認知到中國和北美的商業和科技環境的不一樣,國內大多企業沒有那么多的錢會燒在一個未知的預測上。“要花很多的錢,要花很多時間,短期內難有商業價值,誰也不知道這個是不是可行。”
“本質是專注和決心,是有沒有做到 AI First。”李笛直言,好幾年前看到 Open AI,他們做到了全情投入,這也是唯一的不同,Open AI 花了足夠的時間和精力在賭,敢于相信一個暴力出奇跡的大模型,但他們那個賭小冰確實不敢賭,“創業生死一線間,某種意義上,如果 Open AI 不推出 Chat GPT,他們今天可能很堪憂了。”
田濤源看來,這件事給大家一個啟發:我們對人工智能硬件(例如芯片)非常重視,但是人工智能的基礎軟件(例如大模型、訓練框架、大數據工具鏈),是不是長期投入不足、沒有足夠重視?有沒有決心進行長期的基礎研發投入?
中國投資與產業界更在乎短期商業回報上的表現,即快錢。“在中國是大家看到哪個技術到了商業價值轉化的臨界點,所有人一擁而上,對許多大型科技或實體行業龍頭企業來說,AI 基礎科研重視程度不足,缺乏大模型自研能力和戰略定力,大家以快速產出的應用為導向,而技術算法的研發必須要很長時間的積累。”田濤源講。
但一些極擅長工程化的中國 AI 公司入場,也必將攪動全球 AIGC 市場。
夏令講中國優秀的 AI 初創公司擁有非常明確的一點優勢,就是具備很強的工程化能力,搭建一個相比 openAI 成本更低、迭代效率更高、更滿足明確優化目標要求的模型是可以實現的。
同時,中國整個應用場景具備足夠的豐富性。“我們這么大的人口基數,產業數字化基礎也已經初步具備,中國在高質量反饋數量上有優勢,而這對新一代 AI 模型格外重要。我們看重的 AIGC 公司要有比較好的工程化能力,對中國實際的商業場景有自己獨到認知,我們認為只有這樣的公司最有機會能夠跑出來。”夏令講。
中國版 ChatGPT 的危與機
隨著 ChatGPT 爆火,這一舊金山誕生的技術引爆了全球人工智能產業,AI 公司近乎全面入局,經濟鏈條的最上游資本市場也出現了震蕩,預示變革的信號彈一枚接一枚地炸響。
(圖為張頎 AI 繪畫作品,由受訪者供圖)
“中國一定要有自己的 GPT-4,即基礎模型(大模型)。”
田濤源強調,“中國的科技創業團隊應有危機感。”ChatGPT 也好,基礎模型也好,越多的開發者、越多樣化的高質量數據、使用場景,對基礎模型的反饋和優化就是越有價值。“誰先去做強化學習,誰就具備先發優勢,這對于我們是一個很大動力和壓力。”
藍馳創投肯定地告訴記者,內容本身是非常區域化、地緣化的,也和用戶數據息息相關,所以更高規格的 AIGC,應該要對當地的文化有深度理解,本身中國市場足夠大,相信針對中國市場通過 AI 生產內容,將有巨大的機會。
而在機會的另一面,是所有 ChatGPT 面臨的最大門檻 ——“安全和合規”。
2016 年,微軟就做出了聊天機器人,可以實時地通過用戶反饋,并修改自己的回答,但一經發布后,24 小時就被教成了種族主義者,很快就被下架了。“我們的實驗室也有自己的對話機器人,過去這個是不敢放出來的。”一位頭部 AI 公司創始人告訴《后廠村 7 號》欄目。
談到具體落地,資深人工智能研究者田濤源提出:“OpenAI 官方在 2020 年 7 月發布的《Language Models are Few-Shot Learners》報告中對提出了 ChatGPT 背后語言大模型的能力邊界與挑戰提醒:
1、表達問題:語義重復,長篇幅段落中失去連貫性、自相矛盾,偶爾不符合邏輯
2、缺少物理常識:GPT-3 很難回答“如果我把奶酪放進冰箱,它會融化嗎?”
3、訓練效率差與世界模型:GPT-3 與人類語言訓練效率存在顯著差距,但 GPT-3 在預訓練期間學習的文本規模遠大于人類一生中看到的文本,以物理世界中額外信息為基礎、算法改進都可能提升效率。
4、不確定性:GPT-3 的少樣本學習存在不確定性、模糊性,未來在準確理解少樣本學習原理的基礎上,能在模型推理時“真正從頭開始”學習新任務。(不清楚人類“從零學習”是否會受以往知識的影響)
5、大模型適用性不好:不方便進行推理,實用性不好,大模型蒸餾到可管理的大小,GPT-3 等大模型包含廣泛的技能,但在特定任務中并不需要,原則上激進的蒸餾“瘦身”是可能的方法,但在對千億參數的大模型上還沒有過嘗試,可能會遇到“決策不易解釋”、 “輸入的預測不易校準”、 “訓練數據的偏差”(數據偏見帶來模型偏見,社會倫理影響)。”
“我看到像 Open AI 的負責人現在也跳出來,主動地說希望被監管。”
在上述 AI 頭部企業創始人看來,這種大模型的最終落地,必然要接受非常嚴格監管。“如果放任發展,過十年它能讓美國那一代學生的教育水平大幅度下滑。”
在他看來,ChatGPT 真正在 C 端出圈,離不開想要借此抄作業的學生,背后涉及的是 AI 倫理問題。“在美國,10 個學生有 9 個過去幾個月迅速知道了 ChatGPT,并通過它寫作業上交,這是它會火爆的一個重要的推手,它解決了實際問題,但是這個解決問題的方法是不正確的。”
他對資本市場所謂的天氣預報不感興趣。這段時間,不乏有投資人找過來,提議去做 ChatGPT 類似的大模型,但他沒有接受這根橄欖枝。“不是特別愛搶這種風頭,我是不會推出一個讓學生抄作業的東西,不管賺再多的錢。”
他希望,選擇去做 ChatGPT 類似應用的同行,能夠更多考慮 AI 倫理的自律問題,提前預估學生拿到它會做什么?被迅速鋪開怎么辦?“盡力做好安全和合規吧,讓它 last for long,能夠持續的存在。”
談到安全和合規問題,百度文心一格相關負責人向記者表示,希望可以厘清各方合規權責,兼顧內容安全和業務創新發展,建議基于不同的細分應用場景和產品模式特點,分類分級制定可落地規則,未來可以鼓勵行業領先企業主動分享創新合規實踐經驗,推動形成行業標準,打造可借鑒的產業合規實踐方案。
業內有共識,對于 ChatGPT 的討論,未來幾年都不會停歇。
但明確的是,ChatGPT 以及其對應的大模型發展,就是未來的一個技術革命,可能還沒有到達大家想象的那種令人恐慌的程度,但確實會讓未來幾年的創新得以釋放。
在田濤源看來,大家現在執著于去搞 ChatGPT,放眼整個人工智能未來,只是其向前邁進的一塊墊腳石。“再往上走,還有更多巨大的機會。”
在他的想像中,AI 可以推動人類對航天的探索、對新能源的探索、對新材料的重大發現,隨著它對物理規律認識的越透徹,對人、對環境、對生命體的認知越來越深刻,能夠逼近一些人類認知范圍以外的未知知識,甚至具備新知的可能性。
在這場或許比移動互聯網更加顛覆的大變革里,對于中國 AI 企業,距離終點仍有漫長的道路要尋找、摸索、攀登。
(應受訪者要求 AI 創業者陳東為化名)