◎記者 羅茂林
年初爆火的《狂飆》,劇名正暗合了AI大模型的這一年。
2月ChatGPT“帶火”OpenAI時,行業還預測國內追趕尚需時日;但轉眼的5月,一場聲勢浩大的“百模大戰”便拉開帷幕。頭部公司爭先恐后,中小廠商一路追趕,生怕錯過時代的列車。
有人說這是人類“科技革命的前夜”,也有人在質疑其商業落地仍遙不可及。
這是一個注定不會寂寞的行業。“臥薪嘗膽”的谷歌“一聲長嘯”,推出匹敵GPT的新模型Gemini,也將“原生多模態”定格在了這新舊交替的節點上。
這也是一個注定不會一帆風順的行業。OpenAI高層“宮斗”禍起,讓這家900億美元市值的“獨角獸”秒變“草臺班子”。這讓外界得窺狂飆之下,行業內部深層的分歧與矛盾的激化。
2024年,將是屬于大模型的一場歧路之旅。
分歧
在最近的一場論壇上,昆侖萬維CEO方漢提出了一個頗為有趣的觀點——大模型行業里,小廠才有顛覆性創新。用他的話來說,本來就沒有用戶,沒有市場,不如放手一搏。
持同樣觀點的人還有百川智能創始人王小川,他相信,小廠更擁有顛覆傳統模式的能力。而這無疑與此前行業的預判有著明顯分歧。
直到今天,市場上對于大模型的普遍認知依然是——只有巨頭能夠參與的賽道。一家上海創投機構的負責人就算了一筆簡單的賬:“別的不說,光騰訊、字節跳動和百度儲備的GPU芯片,就是上百億的資產。”
但歷史一再證明,科技的突破有時并不遵循行業的“普遍認知”。就以大模型為例,早在年初方漢就對記者預言,大模型的技術架構可能沒有想象中那么復雜。“如果僅僅是做出大模型的話,中國可能不需要三五年。”
事實證明也是如此。一年來,大模型如雨后春筍,百度、阿里、華為、京東等互聯網大廠重金押注,無一缺席。截至2023年10月,我國擁有10億參數規模以上大模型的廠商及高校院所共計254家,分布于20多個省市/地區,國內大模型總數達238個。
隨著行業的快速發展,分歧與爭議也日益增多。通用模型好還是垂類模型好?是否商業化?如何商業化?何時商業化?誰能率先商業化?以至于在如今一場接一場的各類論壇中,大模型成為“逢會必談”卻也“空泛無物”的熱門話題。
11月底,在OpenAI董事會內部上演的一場“權力游戲”,或許可以視為窺探如今行業深層分歧的一個契機。一方面是首席科學家對于AI安全性的高度擔憂,另一方面是CEO阿爾特曼對于AI激進的商業化策略。
有科學家直言,人類處于前所未有的AI威脅當中。但與此同時,大眾對大模型的感知依然停留在“聊天機器人”層面。似乎除了自動生成廣告圖和永遠看起來不怎么聰明的AI客服外,大模型眼下并沒有更好的用武之地。
“大模型行業最終99%都會死去。”相較于許多人的樂觀贊美,王小川的話在此刻顯得頗為殘酷。
關口
總體來看,國內頭部大模型的水平大致相當于OpenAI的GPT-3.5,距離GPT-4依然有差距。而要想實現技術上的突破,方漢認為需要突破三大關口:算力、算法、數據。
最引人注目的莫過于算力之爭。事實上,大模型崛起的最先獲益者并非AI公司,而是芯片廠商英偉達。今年二季度,英偉達數據中心業務占比首次全面超越游戲板塊。
今年以來,“算力緊張”已經成為行業常態,一張英偉達高性能顯卡價格更是“一天一價”。一位英偉達代理商告訴記者,目前國內所有英偉達系GPU配置的算力中心都處于“滿租”狀態。“只要有顯卡服務器來,根本不愁大廠簽約。”
也有業內人士感慨:過去一年見了100多家客戶,只有一家自己擁有算力,其他人都沒有。大模型所需的算力緊俏程度由此可見一斑。
中原證券電子行業分析師鄒臣認為,AI大模型預訓練數據量呈指數級增長,算力已成為推動數字經濟飛速發展的新引擎。而據AMD預計,2023年AI芯片市場的規模將達到450億美元左右,至2027年將飆升至4000億美元,2023年至2027年復合增速超過70%。
算力硬件上的短板,短期內可以通過算法優化加以解決,而這恰恰構成行業發展的另一關口。
據脈脈高聘人才智庫發布的《2023泛人工智能人才洞察》顯示,今年1月到8月,新發AI崗位平均月薪超4.6萬元,人才供需比僅為0.39,相當于5個崗位爭奪2個人才。
vivo副總裁周圍接受媒體采訪時曾表示:“vivo大模型現在每年20億至30億元的投入成本,總投入成本已經超過200億元,人才和數據算力各占一半,人才成本平均每人稅后100萬元。”
而具體到部分領域,這種人才短缺就更為明顯。商湯科技醫療板塊的相關負責人此前就告訴記者,如今跨專業復合學科背景的人才對于行業至關重要。
數據如今更是行業發展難以突破的“險關”。且不論數據訓練的方法是各家秘而不宣的核心機密,單數據篩選就已是巨大的挑戰。
高質量的數據對大模型訓練至關重要,天娛數科副總經理賀晗就曾對記者表示,國內各領域數據“多而不精”“壁壘森嚴”等問題都阻礙行業發展。網易伏羲工程機械產品負責人楊新偉也直言:“工業領域高質量數據太少。”
落地
今年年初OpenAI真正引爆市場的關鍵,在于ChatGPT成為史上用戶數破億最快的應用。這讓資本看到了商業落地的可能性。經過一年發展,如今全球頭部的大模型都開始進入商業化落地的環節。
今年下半年,國內大模型的商業布局落地速度也顯著加快。12月22日,在全國信息技術標準化技術委員會人工智能分委會全體會議上,百度、騰訊、阿里的大模型首批通過大模型標準符合性測試,標志著在商業落地上,國產大模型又邁出重要一步。
據百度負責人介紹,今年以來,文心大模型保持快速迭代,5月升級至3.5版本,10月再次迭代至4.0版本,其理解、生成、邏輯、記憶四大能力顯著提升。同時,通過飛槳與文心的協同優化,模型周均訓練有效率超過98%,訓練算法效率提升3.6倍。
在商業方面,百度文心一言負責人王海峰日前透露,文心一言用戶規模現已達到7000萬,場景4300個。不過王海峰并未具體介紹如今文心一言具體的營收情況。
面向商業化場景的華為盤古大模型,在年末也有新動作。在12月的活動上,華為方面透露,目前有7家創業公司與華為云簽署合作協議。未來華為云將與簽約企業繼續基于昇騰AI云服務和盤古大模型進行聯合創新,一派生態圖景已然徐徐展開。
不過記者也注意到,除了百度之外,目前其他大模型廠商大都未向外界披露具體用戶的情況,且很多大模型均為垂類模型,僅對特定的用戶開放。
投融資活躍度是檢驗市場對于商業化落地情緒的最好指標。數據顯示,今年中國AI領域融資214億元,百川智能、Minimax和智譜AI三家公司在資本市場尤為受歡迎,融資額占比超過30%。
但除了三家頭部企業,其他初創公司的融資情況可能并非那么樂觀。
據第三方數據機構企名片數據顯示,今年國內共有26家大模型初創公司拿到融資,基本是種子輪或天使輪。相比于“雷聲滾滾”的論壇會場,市場上真金白銀的“雨點”就略顯稀少。
有創業者發現,如今市場對于大模型項目的市場需求、技術實力、商業模式以及團隊能力等方面的情況會有更多考量。換言之,能否在短期內商業化賺到錢成為重要的指標。顯然,在如今的大環境下,投資市場也變得異常謹慎。
“目前大家需要承認的是,大模型說了半天,但落地并不是很理想。”瀾舟科技創始人兼CEO周明說道,“我認為過去一年大家在醞釀情緒,找對接口,明年可能是爆發點。”也有許多投資者認為,盡管大模型市場曾有不少奇跡,但明年這個市場最大的可能性,依然屬于頭部廠商。