2023世界人工智能大會上多家企業(yè)展示AI大模型產品和應用
出品 | 搜狐科技
作者 | 梁昌均
編輯 | 楊錦
“看得多、投得少”,“觀望氣氛比較濃厚”。談及投資機構今年對AI大模型創(chuàng)業(yè)的態(tài)度,這是國內一些投資人和創(chuàng)業(yè)者的感受。
但在產業(yè)界,AI大模型依然火爆。剛剛結束的世界人工智能大會上,超30個大模型集體秀肌肉,國內互聯(lián)網大廠和不少AI企業(yè)都已踏進大模型這條滾燙的賽道,百模大戰(zhàn)已然開啟。
在創(chuàng)投市場,王慧文、王小川、李開復等大佬先后入場,喊出要做中國的OpenAI、做中國最好的大模型等宣言,成為這波AI大模型浪潮中重要的一股勢力。
據(jù)搜狐科技不完全統(tǒng)計,今年上半年,至少有20家大模型公司獲得超過60億元的融資。從全球來看,相關融資數(shù)量超過50筆,中美占據(jù)大頭,均超20筆,涉及總額達1000億元。
雖然國內交易次數(shù)較多,但金額在全球占比僅有6%,國內投資人出手并不闊綽,AI大模型投資市場稍顯冷清。
同時,目前各方對大模型的創(chuàng)業(yè)價值并未達成共識,金沙江創(chuàng)投主管合伙人朱嘯虎和獵豹移動董事長傅盛早前就因此互嗆開懟。
遠望資本創(chuàng)始人、迅雷創(chuàng)始人程浩判斷,全球通用大模型不會超過10個,創(chuàng)業(yè)機會不大。這基本成為投資圈共識,百度CEO李彥宏此前也表示沒必要重復造輪子。
但不少創(chuàng)業(yè)者難以認同。王小川就認為,創(chuàng)業(yè)公司一定有機會,而且沒有包袱和更大的商業(yè)化壓力,會比大公司跑得更快。
出門問問工程副總裁&首席科學家李維則對搜狐科技表示,大廠壟斷通用大模型不大可能。“很多創(chuàng)業(yè)公司都推出了大模型,證明這件事已不是太大問題。”
盡管存在分歧,但也有共識,應用將是關鍵。從觀望要不要做,到各路玩家紛紛入場,大模型已到要回答如何落地的階段。無論對大廠,還是對創(chuàng)業(yè)公司來說,這都是一張必答卷。
大佬入局自帶光環(huán),誰在投資大模型?
ChatGPT橫空出世,掀起第三波AI浪潮的大模型高峰,一批大佬下場創(chuàng)業(yè)。搜狐科技不完全統(tǒng)計,今年上半年,至少有20家大模型企業(yè)獲得融資,且集中在早期的天使輪或A輪。
這些創(chuàng)業(yè)者基本自帶光環(huán),既有李開復、王慧文、王小川、李志飛、周伯文等有過創(chuàng)業(yè)或大廠背景的大佬,也有清華、人大、西湖大學等學院派新秀,其中清華尤為典型,生數(shù)科技、深言科技、月之暗面、清昴智能、面壁智能、聆心智能等背后都站著清華教授。
今年上半年公開獲得融資的AI大模型企業(yè) 資料來源:公開信息、天眼查
從投資方來看,既有騰訊、百度風投、螞蟻集團、好未來等產業(yè)資本,也有紅杉、IDG、真格基金、創(chuàng)新工場、啟明創(chuàng)投、經緯創(chuàng)投、奇績創(chuàng)壇等風投。紅杉最為活躍,至少出手5次,包括光年之外、深言科技、月之暗面和Project AI 2.0,騰訊則投資了光年之外、MiniMax、深言科技。
在融資規(guī)模上,此次統(tǒng)計的項目披露的融資總額超過60億元。而公開數(shù)據(jù)顯示,今年上半年,全球涉及AI大模型的企業(yè)融資有51筆,投融資金額超1000億元,即國內交易數(shù)量占比近40%,但融資金額僅有約6%。
美國市場多筆大額交易占去了多數(shù)份額,包括微軟向OpenAI投資100億美元,比爾·蓋茨、微軟、英偉達等牽頭向Inflection AI投資13億美元,美國數(shù)據(jù)公司Databricks以13億美元收購MosaicML。僅這三筆交易,金額占比就達到全球的九成左右。
這也在一定程度上顯示出,雖然國內大模型內卷激烈,資本市場概念股翻倍暴漲,但一級市場投資人還是比較謹慎,尤其在大額交易方面遜色不少。
從事創(chuàng)投FA業(yè)務的42章經創(chuàng)始人曲凱透露,目前幾乎所有的美元基金都在看AI,有些人民幣基金也感興趣。“很多機構看得很積極,但最后會出手的并不多,大概會有五六十家。”
出門問問工程副總裁&首席科學家李維也能感受到,投資界實際非常關注和看中大模型,但也很審慎。“畢竟這是一個投入大,但商業(yè)模式目前并不清晰的新技術方向。”
天使投資人、人工智能資深專家郭濤對搜狐科技分析稱,越來越多的投資機構已意識到AI大模型面臨投資金額大、回報周期長、成功率較低、行業(yè)競爭激烈、監(jiān)管日益趨嚴等問題,因而出手趨于謹慎,目前觀望氣氛比較濃厚。
同時,郭濤認為,目前值得投資的AI大模型企業(yè)并不多,多數(shù)創(chuàng)業(yè)公司在技術、數(shù)據(jù)和生態(tài)層面幾乎不具有顯著優(yōu)勢,多數(shù)是以小成本試錯的態(tài)度去嘗試,很難獲得投資機構的青睞。
此外,很多被看好的明星公司估值太貴,典型如光年之外,短短三個月估值從2億美元沖到10億美元,很多機構望而卻步。這家公司的結局也頗為唏噓,王興的美團以超20億元出手“救”下兄弟和投資者,王慧文因病提前退場。
延續(xù)互聯(lián)網投資偏好,退熱后開始拼落地
在AI大模型具體的投資方向上,投資機構幾乎延續(xù)了互聯(lián)網投資時代的偏好,應用層最受青睞。程浩稱,遠望資本就主要投中間件和應用層的公司。
曲凱透露的數(shù)據(jù)顯示,今年拿到錢的AI項目中,做模型的有10%-20%,做infra/中間層的有20%-30%,做應用層的則有60%-70%。如果不算拿到錢的項目,做應用的項目可能達到95%。
從底層infra(如芯片、框架等基礎設施),到模型層、中間件,再到各種應用,AI大模型產業(yè)也形成類似芯片產業(yè)的倒金字塔結構。在底層依賴國外開源技術且難以突破的情況下,國內創(chuàng)業(yè)公司大多押注應用層,成本高的模型層也僅是少數(shù)公司的游戲。
李維認為,創(chuàng)業(yè)公司主要做基礎大模型和大模型下游應用,都去做基礎大模型既不現(xiàn)實,也沒必要。“因此很多初創(chuàng)公司傾向做垂直場景應用,以API調用或OEM私有化部署的方式,借力大模型供應方的大模型服務,聚焦數(shù)據(jù)和應用的創(chuàng)新研發(fā),這會是比較清晰的方向。”
不過,這波大模型熱潮似乎已開始趨冷,常引用的例證是ChatGPT流量見頂。據(jù)第三方網站SimilarWeb數(shù)據(jù),今年6月ChatGPT的網站與移動客戶端的全球流量環(huán)比下降9.7%,系去年底以來首次下滑,訪客在網站上花費的時間也下降8.5%。此外,微軟Bing、Character.AI等網站流量在6月也出現(xiàn)不同程度下滑。
“最近一兩個月市場漸冷,原因是最近大模型的質變在減少,新出來的創(chuàng)業(yè)者和能講的新故事都比年初少了一些。但每個賽道和熱點都是有起有伏,這很正常。”曲凱表示。
他認為,AI大模型下一個階段要拼實際的落地,下一波熱點大概要在兩三個月后,大量上半年拿到錢的項目,需要幾個月才能完成產品上線,那時可以再看是否能出現(xiàn)更多更好的killer App,也可以看下誰到時會是應用層的帶頭大哥。
實際上,目前大廠也在拼大模型落地和商業(yè)應用。華為近日在發(fā)布盤古3.0時就表示,希望用其來幫助各行各業(yè),而非專注在語音大模型層面。“我們忙著做事,沒有時間作詩。”
郭濤認為,雖然AI大模型有所降溫,但整體來看還將會持續(xù)一年左右的時間,而關注點將逐步從底層技術層面過渡到垂直應用層面。
小冰CE0李笛則判斷,現(xiàn)在的大模型同質化嚴重,市面上根本用不了這么多大模型,2024年應該就會退熱,發(fā)現(xiàn)誰在岸上誰在裸泳。
通用模型沒機會?垂直賽道同質化嚴重
對創(chuàng)業(yè)者來說,如何在入場前想好方向極其關鍵。朱嘯虎表示,ChatGPT對創(chuàng)業(yè)公司很不友好,未來兩三年內要放棄融資幻想。傅盛就此互懟,稱“我們的投資人無知者無畏”。
隨后,朱嘯虎又解釋到,自己并非否定大模型領域創(chuàng)業(yè)機會,而是提醒創(chuàng)業(yè)者不要迷信通用大模型。“對于大部分創(chuàng)業(yè)者,場景優(yōu)先,數(shù)據(jù)為王。”
這種觀點基本已成為當下國內投資圈的共識。郭濤認為,通用大模型將會形成一定壟斷局面,創(chuàng)業(yè)者和“小廠”布局通用大模型,在資金、技術、數(shù)據(jù)和生態(tài)上均處于劣勢地位。
“通用大模型護城河非常高,它的網絡效應也很強,用戶反饋會讓它越來越聰明,先做出來的企業(yè)會有先發(fā)優(yōu)勢。”程浩也認為,創(chuàng)業(yè)公司做通用大模型機會不大,只有大廠能玩得起。
同時,他認為,未來通用基座模型也不需要那么多公司。“可能全世界未來真正能夠用到的閉源和開源加起來的通用大模型不超過10家,這還是往多了說。”
但不少創(chuàng)業(yè)者并不認同。“很多創(chuàng)業(yè)公司已推出大模型,證明這件事不是太大問題。如果要達到GPT-4的水平,頭部大廠同樣很困難,想要壟斷現(xiàn)在看來也不大可能。”李維表示。
他認為,創(chuàng)業(yè)公司做大模型雖然在硬件資源和工程力量上無法與大廠相比,但優(yōu)勢是更接地氣,有總體的落地路徑或產品需求,不是為了大模型而大模型。
“基礎大模型也并非鐵板一塊,有一定的伸縮余地,創(chuàng)業(yè)公司可以從十億、百億的模型練起,然后根據(jù)自身需求和后續(xù)資源來決定是否繼續(xù)研發(fā)千億級別的模型。”李維表示。
不少創(chuàng)業(yè)公司做大模型正是遵循這樣的路線。比如百川智能先推出70億參數(shù)模型,并還在訓練500億參數(shù)模型,基本沒有創(chuàng)業(yè)公司選擇去做千億參數(shù)的大模型。
在李維看來,模型大小不是唯一的指征,應用場景也是重要的參考維度。“對于大多數(shù)應用,超大規(guī)模模型就像是大炮打蚊子,不僅推理時間長,費用大,而且很難應用部署,在實際效果上并沒有什么意義。”
因此,李維認為,盲目競爭求大求全,不應該是大模型研發(fā)創(chuàng)新的主流,推動大模型輕量化、垂域化是更有意義的良性競賽,這對推動大模型盡快落地和產生價值至關重要。
程浩認為,未來很多中小企業(yè)會有自己的垂直模型,而創(chuàng)業(yè)公司更多的機會是在垂直賽道上做應用或工具鏈。“大部分投資機構還都是看垂直行業(yè)的賽道,像王小川、王慧文這種,很大程度上是在賭人,并不是賭做通用大模型這件事。”
不過,選擇垂直賽道的技術路線也面臨不少挑戰(zhàn)。李維就坦言,大模型在垂直領域的規(guī)模化落地會比想象的要艱難。
他認為,目前的挑戰(zhàn)之一是變化太快,讓人眼花繚亂,創(chuàng)業(yè)公司與大模型供應方的對接和互選產生困難,多數(shù)大模型還未出現(xiàn)可以應用的成熟服務,上下游存在無法無縫對接和匹配的問題。
同時,目前還存在技術同質化、商業(yè)互卷等問題。“鼓勵技術競爭和模型差異化發(fā)展,協(xié)調商業(yè)合作、減少商業(yè)互卷是技術公司和社區(qū)應該共同努力的方向。”李維呼吁到。