作 者丨馮戀閣 王俊 實(shí)習(xí)生孔雅萱
編 輯丨王俊
開(kāi)源還是閉源?這是屬于大模型的時(shí)代之問(wèn)。
今年年初,埃隆·馬斯克在對(duì)AI target=_blank class=infotextkey>OpenAI及其CEO薩姆·奧特曼提起訴訟時(shí),就對(duì)OpenAI逐漸不公開(kāi)其模型研究相關(guān)細(xì)節(jié)的行為大加譴責(zé)。“時(shí)至今日,OpenAI公司網(wǎng)站還宣稱,它的宗旨是確保通用人工智能造福全人類(lèi)。然而,在現(xiàn)實(shí)中,OpenAI已經(jīng)轉(zhuǎn)變?yōu)榭萍季揞^微軟事實(shí)上的閉源子公司。”這位曾經(jīng)的OpenAI聯(lián)合創(chuàng)始人如此表示。
OpenAI不夠“Open”,META卻“Open”了自己最新的開(kāi)源人工智能模型。
4月18日,Meta 發(fā)布了其最新版本的開(kāi)源大模型 Llama 3,引起開(kāi)源AI社區(qū)的一陣歡呼。巧合的是,Llama 3發(fā)布當(dāng)天正好是AI領(lǐng)域頂尖學(xué)者、AI開(kāi)源倡導(dǎo)者吳恩達(dá)的生日。“(Llama 3是)至今為止最好的禮物,謝感謝Meta!”他說(shuō)。
行至2024,開(kāi)閉源之爭(zhēng)日漸白熱化。閉源陣營(yíng)以目前最強(qiáng)的OpenAI為代表,開(kāi)源陣營(yíng)Meta的LLaMa、Mistral和google等也在不斷迭代。閉源陣營(yíng)堅(jiān)持對(duì)Scaling Law的信仰,押注在更強(qiáng)通用模型的打造上;開(kāi)源陣營(yíng)模型能力不斷提升,并且強(qiáng)調(diào)以更垂直的性能、更靈活的配置來(lái)推動(dòng)大模型商業(yè)化落地。
關(guān)于應(yīng)該選擇模型開(kāi)源還是閉源討論經(jīng)久不息。
對(duì)于局內(nèi)人,這一選擇這不僅決定了他們將如何點(diǎn)亮AI“科技樹(shù)”,更將影響他們的商業(yè)路線選擇。換言之,這很有可能是這個(gè)殘酷競(jìng)爭(zhēng)市場(chǎng)下的生存問(wèn)題。
兩個(gè)版本,多重驚喜
Meta此次發(fā)布的Llame 3包括8B和70B的預(yù)訓(xùn)練和指令微調(diào)版本。
據(jù)Meta官網(wǎng)信息,Llama 3 模型將數(shù)據(jù)和規(guī)模提升到新的高度。它在兩個(gè)定制24K GPU集群上基于超過(guò) 15T 的數(shù)據(jù)進(jìn)行了訓(xùn)練——訓(xùn)練數(shù)據(jù)集是Llame 2使用量的7倍有余。它支持 8K 上下文長(zhǎng)度,是 Llama 2 容量的兩倍。
除了 Llama 3,Meta 還發(fā)布了新的信任和安全工具,包括Llama Guard 2、Code Shield和 CyberSec Eval 2。
據(jù)悉,Llama 3 即將在AWS(Amazon web service)、Databricks、Google Cloud、Hugging Face、Kaggle、IBM WatsonX、 Microsoft Azure等主要云提供商、模型 API 提供商平臺(tái)上線,Llama還得到AMD、AWS、戴爾、英特爾、Nvidia和高通提供的硬件平臺(tái)的支持。
在官網(wǎng)上,Meta還放出了Llama3兩個(gè)版本與谷歌Gemma、谷歌Gemini、Mistral、Anthropic的Claude 3等競(jìng)爭(zhēng)對(duì)手的參數(shù)對(duì)比。據(jù)Meta官網(wǎng),Llame3在MMLU(學(xué)科知識(shí)理解)、GPQA(一般問(wèn)題)、HumanEval(代碼能力)、GSM—8K(數(shù)學(xué)能力)、MATH(比較難的數(shù)學(xué)問(wèn)題)5個(gè)評(píng)測(cè)集上均表現(xiàn)良好。
值得注意的是,Llama3的代碼能力非常優(yōu)秀。在AI領(lǐng)域公眾號(hào)“數(shù)字生命卡茲克”主理人卡茲克分享的用戶實(shí)測(cè)中,Llama3—8B能夠給出國(guó)際象棋中經(jīng)典皇后問(wèn)題的解題代碼。而其前代版本Llama2需要專(zhuān)門(mén)的代碼模型才能實(shí)現(xiàn)。
市場(chǎng)的反應(yīng)速度很快。18日當(dāng)天,Meta股價(jià)逆勢(shì)收漲1.54%。次日,百度智能云千帆大模型平臺(tái)開(kāi)放邀約測(cè)試,提供針對(duì)Llama 3的訓(xùn)練推理方案,幫助開(kāi)發(fā)者訓(xùn)練專(zhuān)屬大模型。
8B和70B 兩個(gè)型號(hào)的模型,僅僅標(biāo)志著 Llama 3 系列的開(kāi)端,Meta AI首席科學(xué)家楊立昆在其社交媒體透露,在接下來(lái)的幾個(gè)月,還會(huì)有更多版本陸續(xù)發(fā)布。
英偉達(dá)高級(jí)科學(xué)家Jim Fan認(rèn)為之后可能會(huì)發(fā)布的Llama 3-400B以上的版本將成為某種“分水嶺”,開(kāi)源社區(qū)將能用上GPT-4級(jí)別的模型。
不下牌桌,各顯神通
上一輪元宇宙競(jìng)爭(zhēng)中被認(rèn)為可能跌進(jìn)坑里的Meta,在人工智能的牌桌上打出了Llama系列這把好牌。要討論Llama3帶來(lái)的行業(yè)震蕩,首先要明白,什么是大模型領(lǐng)域的開(kāi)源?
大模型領(lǐng)域的開(kāi)源通常意味著模型的架構(gòu)、訓(xùn)練代碼和預(yù)訓(xùn)練權(quán)重等都被公開(kāi),允許研究人員和開(kāi)發(fā)者自由地訪問(wèn)和使用。
不過(guò),開(kāi)源的程度因模型而異。“有些可能只提供有限的訪問(wèn)權(quán)限或部分代碼。”郭濤指出,判斷大模型是否真正開(kāi)源的基準(zhǔn)可能包括:代碼和數(shù)據(jù)的可訪問(wèn)性、使用許可的寬松程度、社區(qū)支持的活躍度以及對(duì)改進(jìn)和新應(yīng)用的開(kāi)放性。
放眼AI界,兩條路徑上都各有“頭號(hào)玩家”分布。閉源自不必說(shuō),海外有OpenAI旗下的ChatGPT,國(guó)內(nèi)是百度的文心一言以及風(fēng)頭正勁的月之暗面Kimi。
而開(kāi)源方面,除了Llama系列,目前應(yīng)用較廣的開(kāi)源大模型還包括非營(yíng)利組織LAION推出的OpenFlamingo、Databricks的Dolly,以及MosaicML的MPT等。國(guó)內(nèi)則包括,阿里巴巴的通義千問(wèn),智譜的ChatGLM-4、百川智能的baichuan-7B中英文大模型、北京智源悟道3.0大模型系列和面壁智能的CPM-Bee 10B中文基座大模型等。
形成這樣的分化,很多時(shí)候是受技術(shù)進(jìn)步和商業(yè)模式迭代等的多重影響。
天使投資人、資深人工智能專(zhuān)家郭濤認(rèn)為,從技術(shù)角度來(lái)看,開(kāi)源可以促進(jìn)學(xué)術(shù)界的研究和創(chuàng)新,而閉源則有助于在一定時(shí)間內(nèi)保持技術(shù)領(lǐng)先優(yōu)勢(shì)。
從商業(yè)角度來(lái)看,開(kāi)源可以吸引開(kāi)發(fā)者社區(qū)的貢獻(xiàn),促進(jìn)技術(shù)的快速迭代和應(yīng)用的廣泛傳播,但可能會(huì)影響到公司的盈利模式。閉源則可以保護(hù)知識(shí)產(chǎn)權(quán),為公司創(chuàng)造直接的收入來(lái)源,但可能會(huì)限制技術(shù)的普及和生態(tài)的建設(shè)。
事實(shí)上,在Llama3發(fā)布之前,中文互聯(lián)網(wǎng)剛剛經(jīng)歷了一輪開(kāi)閉源論戰(zhàn)。
據(jù)媒體報(bào)道,百度CEO李彥宏近日表態(tài),認(rèn)為大模型開(kāi)源意義不大,閉源模型性能會(huì)不斷提升。“有了文心大模型4.0,我們可以根據(jù)需要兼顧效果、響應(yīng)速度、推理成本等各種考慮,裁剪出適合各種場(chǎng)景的更小尺寸模型,且支持精調(diào)和post pretrain。通過(guò)降維裁剪出的模型,比直接拿開(kāi)源調(diào)出來(lái)的模型,同等尺寸下效果更好,同等效果下成本明顯更低。”
李彥宏一直是閉源路線的忠實(shí)擁躉,理由包括但不限于認(rèn)可閉源商業(yè)模式可以更好地聚集人力和財(cái)力等。
而其反對(duì)者——360創(chuàng)始人周鴻祎言簡(jiǎn)意賅,“一句話,今天沒(méi)有開(kāi)源就沒(méi)有 linux,沒(méi)有 Linux 就沒(méi)有互聯(lián)網(wǎng)。”
“源神”啟動(dòng),影響幾何?
“Llama 3的發(fā)布會(huì)帶來(lái)市場(chǎng)格局的改變。”郭濤在接受21記者采訪時(shí)指出,其優(yōu)異表現(xiàn)可能吸引更多的用戶和投資者,從而增加其市場(chǎng)份額。
官網(wǎng)顯示,Llama 3將有條件地開(kāi)源給商業(yè)使用(月活用戶超過(guò)7億需要單獨(dú)申請(qǐng))。“不過(guò)這基本等于完全免費(fèi)商用了。”卡茲克表示。
此前,投資人朱嘯虎曾經(jīng)就人工智能市場(chǎng)相關(guān)話題接受騰訊新聞采訪。當(dāng)被問(wèn)及2023年大模型發(fā)展的關(guān)鍵節(jié)點(diǎn)時(shí),他給出的回答正是Llama上線。這讓中國(guó)在應(yīng)用層面創(chuàng)新有了基礎(chǔ),降低了商業(yè)化門(mén)檻。
當(dāng)然,朱嘯虎提到的變現(xiàn)是指開(kāi)源生態(tài)內(nèi)的用戶。對(duì)于開(kāi)源大模型發(fā)布者的能否盈利,或者能等來(lái)盈利機(jī)會(huì),很多時(shí)候并沒(méi)有確定的答案。
閉源大模型通常通過(guò)授權(quán)使用、訂閱服務(wù)或者直接銷(xiāo)售產(chǎn)品來(lái)盈利。其中的代表便是AI領(lǐng)域的領(lǐng)跑者OpenAI,雖然其一直有推進(jìn)開(kāi)源項(xiàng)目的動(dòng)作,但其處在核心地位的ChatGPT卻一直采取收取API許可費(fèi)的方式向其他公司提供服務(wù)。在API服務(wù)過(guò)程,其他公司不會(huì)接觸到ChatGPT模型的細(xì)節(jié)和源代碼,僅僅通過(guò)API接口進(jìn)行調(diào)用。
創(chuàng)業(yè)者服務(wù)平臺(tái)GoDaddy對(duì)全美1003家小型企業(yè)的調(diào)查數(shù)據(jù)顯示,ChatGPT以70%的應(yīng)用率成為美國(guó)小型企業(yè)應(yīng)用最多的生成式AI產(chǎn)品,這說(shuō)明OpenAI選擇的閉源模式的商業(yè)化之路在一定程度已經(jīng)跑通。
開(kāi)源模型如何尋求生存和發(fā)展的機(jī)會(huì)?
首先是以開(kāi)放的生態(tài)吸引用戶。國(guó)盛證券研報(bào)就指出,開(kāi)源大模型借助更大標(biāo)識(shí)符訓(xùn)練數(shù)據(jù)集、DeepSpeed、RLHF等方式,實(shí)現(xiàn)低訓(xùn)練成本和高性能,超大模型以下大模型的壁壘正在消失。
“在擁有用戶后,開(kāi)源大模型通常通過(guò)提供增值服務(wù)、定制開(kāi)發(fā)、技術(shù)支持等方式來(lái)實(shí)現(xiàn)盈利”。郭濤指出,公司可以在開(kāi)源模型的基礎(chǔ)上提供專(zhuān)業(yè)的訓(xùn)練服務(wù)或者定制化的應(yīng)用解決方案。
對(duì)于Meta甚至眾多開(kāi)源者而言,開(kāi)源的野心不僅是短期的商業(yè)變現(xiàn),其更想引領(lǐng)規(guī)則設(shè)計(jì)以及搭建生態(tài)。 有業(yè)內(nèi)專(zhuān)家分析,開(kāi)源后壁壘并沒(méi)有那么容易破除,高質(zhì)量、標(biāo)注過(guò)的訓(xùn)練數(shù)據(jù)集尤其是專(zhuān)業(yè)模型的壁壘。
星紀(jì)魅族集團(tuán)數(shù)據(jù)合規(guī)執(zhí)行總監(jiān)朱玲鳳表示,目前有些開(kāi)源AI由頭部公司主導(dǎo),“越多人使用,就越能強(qiáng)化網(wǎng)格效應(yīng),而且不是真正的開(kāi)放,后續(xù)需要使用它們的配套工具、配套服務(wù)。頭部公司還可能利用監(jiān)管豁免的方式,獲得尋租空間。”換言之,以開(kāi)源為噱頭的巨頭游戲,可能會(huì)進(jìn)一步強(qiáng)化大公司的壟斷地位,反而不利于產(chǎn)業(yè)競(jìng)爭(zhēng)。
據(jù)報(bào)道,去年4月,在扎克伯格與分析師的一次電話會(huì)議中,他就談到,如果行業(yè)能夠在Meta使用的基礎(chǔ)工具上達(dá)成標(biāo)準(zhǔn)化,那么meta就能從其他人的改進(jìn)中受益。同年5月,谷歌內(nèi)部泄露的文件《我們沒(méi)有護(hù)城河,OpenAI也沒(méi)有》在SemiAnalysis網(wǎng)站上傳播,其中的觀點(diǎn)包括,比起開(kāi)源社區(qū)需要谷歌,谷歌更需要開(kāi)源社區(qū)等等。文章作者指出,不同開(kāi)源模型所組成的生態(tài)系統(tǒng)永遠(yuǎn)是OpenAI的潛在競(jìng)爭(zhēng)對(duì)手,與開(kāi)源AI競(jìng)爭(zhēng)的結(jié)果必然是失敗。
Meta落子,戰(zhàn)局生變。大模型的路線之爭(zhēng)會(huì)不會(huì)迎來(lái)真正的勝利者?
“開(kāi)源與閉源大模型之間不太可能分出絕對(duì)的輸贏,因?yàn)樗鼈兏髯赃m合不同的應(yīng)用和場(chǎng)景。”郭濤認(rèn)為,開(kāi)源大模型更適合那些需要快速創(chuàng)新和大規(guī)模協(xié)作的項(xiàng)目,而閉源大模型可能更適合那些對(duì)性能和安全性有極高要求的商業(yè)應(yīng)用。