“百模大戰(zhàn)”開打,未來誰將脫穎而出?
在今年的世界人工智能大會上,大模型占據(jù)當仁不讓的C位,國內(nèi)外總計30余款大模型集體亮相,據(jù)記者不完全統(tǒng)計,其中既有來自企業(yè)巨頭華為、百度、阿里、京東等推出的通用大模型,也有來自清華、復旦等學院派大模型,還有包括出門問問、第四范式等創(chuàng)業(yè)公司入局,“廝殺”尤為激烈。
從起初的算法、算力,到如今的應(yīng)用場景、商業(yè)空間,業(yè)界對于對大模型的爭論,逐漸從方向前景向應(yīng)用現(xiàn)實層面靠攏。
騰訊副總裁湯道生提到了“通用大模型”和“行業(yè)大模型”兩條不同路徑,如何在最低成本下實現(xiàn)大模型的最優(yōu)選擇,創(chuàng)業(yè)公司如何在巨頭裹挾中找到生存機會,成為今年產(chǎn)業(yè)界的熱議焦點。
入局大模型的兩種范式,有多燒錢?
所謂人工智能大模型,通常指的是經(jīng)過大規(guī)模數(shù)據(jù)訓練后,能夠適應(yīng)一系列任務(wù)的模型。
大模型的“燒錢”已成為業(yè)內(nèi)共識。此前,華為云人工智能領(lǐng)域首席科學家田奇曾在公開演講中表示,大模型可能收編高度定制化的小模型,導致市場向大公司集中,其資本門檻高,大模型開發(fā)和訓練一次1200萬美元。
昆侖萬維此前也在公告中表示,大模型市場已經(jīng)進入10家左右中大型公司,打3-5年持久戰(zhàn)的格局,要做好這件事情,需要長期儲備至少10億美金以上的資金。
作為行業(yè)人士,網(wǎng)易伏羲預(yù)訓練及生成式人工智能平臺負責人趙增向記者介紹,目前企業(yè)入局大模型主要分為兩種范式:第一種是著力于通用能力的基礎(chǔ)大模型,這也是成本最高、最為昂貴的大模型。另一種則是基于基礎(chǔ)大模型的行業(yè)垂直大模型,以大部分創(chuàng)業(yè)公司為例。
基礎(chǔ)大模型以國外的AI target=_blank class=infotextkey>OpenAI,國內(nèi)的阿里、百度等為例,據(jù)浙商證券分析師陳杭此前發(fā)布報告,一片英偉達頂級GPU成本為8萬元,GPU服務(wù)器成本通常超過40萬元,“對于ChatGPT而言,支撐其算力基礎(chǔ)設(shè)施至少需要上萬顆英偉達GPU A100,一次模型訓練成本超過1200萬美元。”
行業(yè)垂直大模型則以騰訊和大部分創(chuàng)業(yè)公司為例。據(jù)騰訊高級執(zhí)行副總裁湯道生表示,基礎(chǔ)通用大模型可以在100個場景中,解決70%-80%的問題,但未必能100%滿足企業(yè)某個場景的需求。基于行業(yè)大模型構(gòu)建自己的專屬模型,雖然參數(shù)比通用大模型少,但是訓練和推理的成本更低,優(yōu)化也更容易,可能是性價比更高的選擇。
“實際上,并不是所有的大模型研發(fā)都需要耗費很大的成本。”趙增向記者透露,具體還是要看其具體的切入點,以及結(jié)合具體場景的應(yīng)用價值、是否使用開源模型等等。
值得注意的是,關(guān)于垂直大模型的成本究竟高不高,目前行業(yè)內(nèi)也有不同說法。京東探索研究院院長、京東科技智能服務(wù)與產(chǎn)品部總裁何曉冬向記者坦言,目前垂直行業(yè)模型的訓練成本和難度并不低,因為行業(yè)模型是建立在通用模型基礎(chǔ)上的。如果只用行業(yè)數(shù)據(jù)進行訓練,會缺乏常識,以電商退換貨為例,比如客戶需要出門,無法在當天進行退換貨,如果過于垂直的行業(yè)模型可能無法準確的理解客戶的意圖,難以進行有效溝通并完成針對性的后續(xù)任務(wù)。
巨頭公司PK創(chuàng)業(yè)公司
據(jù)記者不完全統(tǒng)計,在今年人工智能大會發(fā)布的近30個大模型中,有近十個大模型來源于中小企業(yè),其中不乏創(chuàng)業(yè)公司,包括云天勵飛旗下的“云天天書”、星環(huán)科技旗下的“星環(huán)無涯”、第四范式旗下的“式說”等,和大廠面對面掰手腕,初創(chuàng)公司的機會在哪里?
“在國內(nèi),大模型研發(fā)本質(zhì)不是錢和資源的問題,而是切入點和場景的問題。有很多公司可以通過融資獲得研發(fā)的第一桶金,門檻并不算特別高。”第四范式副總裁涂威威向記者坦言。“大廠的規(guī)模大,團隊也多,不同團隊之間可能出現(xiàn)賽馬競爭,浪費資源,而創(chuàng)業(yè)公司的優(yōu)勢就是能集中大量資源,花費在某個具體模型上的投入未必遜色于大廠。”
他舉例說,大模型就像造工廠,如果建造工廠只為了造一輛車,那確實成本很高,但如果在工廠建成后源源不斷地生產(chǎn)車輛,對每輛車的成本而言并不是很高。目前,各大廠商,包括創(chuàng)業(yè)公司,都還處于“造工廠”的階段,但隨著生態(tài)的不斷完善,未來的成本必然會顯著降低。
“ChatGPT太強大了,對創(chuàng)業(yè)公司很不友好。創(chuàng)業(yè)公司基于ChatGPT能夠創(chuàng)造的價值非常單薄。”此前,知名投資人朱嘯虎曾經(jīng)和獵豹移動 CEO傅盛在朋友圈就創(chuàng)業(yè)公司該不該入局大模型互懟。朱嘯虎認為,大模型摧毀了創(chuàng)業(yè),因為模型、算力和數(shù)據(jù),三大支柱都向大廠集中,看不到創(chuàng)業(yè)公司的機會,且直接在大模型上做應(yīng)用護城河太低。
傅盛卻認為,大模型催生了很多新的架構(gòu)在大模型之上的創(chuàng)業(yè)機會,包括直接在大模型上搭建的不同應(yīng)用和由于數(shù)據(jù)私有帶來的垂直領(lǐng)域的大模型等等。行業(yè)大模型以及基于大模型的應(yīng)用開發(fā),才是大部分創(chuàng)業(yè)者真正能夠抓住的機會。
從資本角度來看,哪怕是大模型“先行者”OpenAI都處于連年虧損的狀態(tài),甚至虧損額還在逐年增加。據(jù)外媒報道,OpenAI去年虧損額度翻倍,達到5.4億美元左右。OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)曾私下表示,公司可能會在未來幾年籌集至多1000億美元資金以進一步開發(fā)人工智能的能力。
也有業(yè)內(nèi)人士看好創(chuàng)業(yè)公司的機遇。一位大廠技術(shù)負責人私下透露,實際上,在生成式AI賽道,目前表現(xiàn)亮眼的都是“小廠”的產(chǎn)品,而大公司的產(chǎn)品往往中規(guī)中矩,缺少亮點,相比大廠,創(chuàng)業(yè)公司的思路更靈活,對新的理念接受也更快,容易誕生有創(chuàng)新和革命性的模式。而且目前較為常規(guī)的通用大模型成本已經(jīng)在可控制的范圍內(nèi),并沒有外界想的那么高。
盡管大模型賽道確實有資金門檻,但其商業(yè)前景受到業(yè)內(nèi)的一致認可,不少業(yè)內(nèi)人士向記者透露,目前大模型賽道已經(jīng)催生出大量商業(yè)機會,其盈利空間是明確的。
“現(xiàn)在各行各業(yè)都結(jié)合大模型的技術(shù),落地場景非常豐富,既有通用場景,也有行業(yè)場景。此前,騰訊已經(jīng)將大模型的能力融入到旗下企點智能客服、數(shù)智人等產(chǎn)品中,也在嘗試云上代碼助手,在普適性的場景下有很多應(yīng)用,同時,各種行業(yè)客戶也帶來了大量的需求。”騰訊云副總裁、騰訊云智能負責人吳運聲告訴記者。
吳運聲認為,目前仍然是大模型發(fā)展的早期階段,呈現(xiàn)出“百花齊放”的狀態(tài),只有更多嘗試和更多投入,才能擁有更多可能性,目前判斷大模型數(shù)量太多或太少,還為時過早。