開源和閉源,一直是大模型時代討論的焦點。
當(dāng)?shù)貢r間4月18日,Meta推出開源大模型Llama 3系列,發(fā)布8B和70B兩個版本。Meta CEO扎克伯格在同一天宣布,基于Llama 3,Meta的AI助手現(xiàn)在已經(jīng)覆蓋Instagram、WhatsApp、Facebook等全系應(yīng)用,并單獨開啟了網(wǎng)站。
當(dāng)晚,獵豹移動CEO傅盛發(fā)視頻稱,Llama 3性能大炸裂,成倍提高數(shù)學(xué)能力,甚至超越部分閉源模型。在他看來,“開源社區(qū)終將戰(zhàn)勝閉源。”
而早在4月11日晚,百度創(chuàng)始人李彥宏的內(nèi)部講話曝光,直言大模型開源的意義不大,這些開源模型都是在外頭零零散散小規(guī)模地去做各種各樣的驗證應(yīng)用,它沒有經(jīng)過大算力的驗證。而且模型開源也不是一個眾人拾柴火焰高的情況。“反觀閉源,是有真正的商業(yè)模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才。”
兩日后,360董事長周鴻祎在哈佛中國論壇的演講中稱:“我一直相信開源的力量,網(wǎng)上有些人胡說八道,你們也別被他們忽悠了,說開源不如閉源好。一句話,今天沒有開源,就沒有l(wèi)inux、沒有互聯(lián)網(wǎng),連說這話的公司自己都是借助了開源的力量才成長到今天,開源社區(qū)聚集的工程師和科學(xué)家的數(shù)量是閉源的數(shù)百倍。我覺得未來一兩年內(nèi),開源的力量很有可能會達到或者超過閉源的水平”
Llama 3引發(fā)云廠商轟動
此次Llama 3開源了2個版本的模型,據(jù)Meta介紹,指令微調(diào)的Llama 3 8B在五項基準(zhǔn)上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三項基準(zhǔn)超過Gemini Pro 1.5和Claude 3 So.NET。
這兩個開源模型發(fā)布后,業(yè)界不少人士相繼發(fā)表了自己的看法。360創(chuàng)始人周鴻祎認為,這兩個開源模型性能很強,應(yīng)該遠遠超過GPT-3.5,Llama問世再次驗證了其對開源的信心。
傳奇研究員,AI開源倡導(dǎo)者吳恩達表示:Llama 3的發(fā)布是自己這輩子收到過的最好的禮物,謝謝你Meta!
Llama 3這兩個版本,也很快登錄云供應(yīng)商。4月19日,百度智能云千帆大模型平臺宣布已成為國內(nèi)首家推出針對Llama 3全系列版本訓(xùn)練推理方案的云廠商。同日,亞馬遜云科技也宣布,Meta Llama 3 基礎(chǔ)模型已可通過 Amazon SageMaker JumpStart來部署和推理運行。
4月22日,阿里云稱魔搭社區(qū)第一時間上架全部4款模型,并宣布百煉大模型服務(wù)平臺在國內(nèi)推出針對Llama 3系列的限時免費訓(xùn)練、部署、推理服務(wù),且限時免除模型開發(fā)和調(diào)用的算力費用。騰訊云也宣布騰訊云TI平臺成為國內(nèi)首批支持Llama 3全系列模型的平臺之一。
云廠商綁定大模型公司以鎖定算力乃至芯片需求,以往并不少見。據(jù)第一財經(jīng)報道,OpenAI背后站著的投資方是微軟,ChatGPT就運行在微軟Azure上。有“OpenAI最強對手”之稱的Anthropic,身后則站著亞馬遜。
由此,云廠商也獲得了可觀的利潤。截至2023年12月31日的2024財年第二季度,微軟智能云營收259億美元,剔除匯率影響后同比增長19%,AI為Azure云貢獻了6個百分點的增長,其中絕大部分增量來自O(shè)penAI在Azure云上的推理調(diào)用。
亞馬遜云服務(wù)AWS則在2023財年第四季度獲得242.04億美元營收,同比增長13%。亞馬遜首席財務(wù)官布奧爾薩夫斯基表示,客戶對AWS生成式AI產(chǎn)品表現(xiàn)出很大興趣,雖然生成式AI服務(wù)體量相對較小,但公司相信其在未來幾年將帶來價值數(shù)百億美元的收入。
國內(nèi)云廠商則在自研大模型的同時,也提供平臺支持第三方模型的接入。比如百度的千帆、阿里云的魔塔社區(qū)、騰訊云的TI平臺。相比推理訓(xùn)練更具中心化特點的閉源模型,諸多云廠商都有機會拼搶算力分散的開源模型部署需求。
英偉達高級科學(xué)家Jim Fan認為之后可能會發(fā)布的Llama 3-400B以上的版本將成為某種“分水嶺”,開源社區(qū)將能用上GPT-4級別的模型。據(jù)第一財經(jīng)稱如果Llama 3 參數(shù)量超4000億版本可以獲得媲美GPT-4的性能,部署該模型的需求攀升,接入Llama 3的云廠商能吃到的算力紅利可能不低于微軟。
開源好還是閉源好?
Llama3的發(fā)布,引發(fā)了云廠商的轟動,同時也讓業(yè)內(nèi)相關(guān)人士驚嘆。AI領(lǐng)域KOL“數(shù)字生命”發(fā)文稱這個消息的振奮程度,對于AI圈來說,甚至不亞于所謂的GPT4.5。圈內(nèi)甚至將Llama3的發(fā)布,定義為一夜重回開源大模型鐵王座。
與此同時,業(yè)內(nèi)關(guān)于“開源”和“閉源”之爭水漲船高。
起初,百度李彥宏的一封內(nèi)部信曝光,在信中他提到,閉源模型在能力上會持續(xù)地領(lǐng)先,而不是一時地領(lǐng)先;模型開源也不是一個眾人拾柴火焰高的情況。這跟傳統(tǒng)的軟件開源——比如Linux、Android/ target=_blank class=infotextkey>安卓等很不一樣。
李彥宏還表示,閉源,是有真正的商業(yè)模式的,是能夠賺到錢的,能夠賺到錢才能聚集算力、聚集人才。閉源在成本上反而是有優(yōu)勢的,只要是同等能力,閉源模型的推理成本一定是更低的,響應(yīng)速度一定是更快的。
此外,李彥宏提到,無論中美,當(dāng)前最強的基礎(chǔ)模型都是閉源的。通過基礎(chǔ)模型降維做出來的模型也是更好的,這使得閉源在成本、效率上更有優(yōu)勢。對于AI創(chuàng)業(yè)者來說,核心競爭力本就不應(yīng)該是模型本身,這太耗資源了,而且需要長時間的堅持才能跑出來。
而360周鴻祎則公開稱自己是開源信徒。4月13日,他在哈佛的演講中強調(diào)了開源的重要性,并指出如果沒有開源文化,就不會有Linux、php、MySQL等眾多重要的技術(shù)成果,甚至互聯(lián)網(wǎng)的發(fā)展也會受到極大的限制。周鴻祎認為,開源不僅推動了技術(shù)的發(fā)展,更是促進了整個產(chǎn)業(yè)的繁榮。
另據(jù)媒體報道,4月上旬,針對大模型開源閉源的路線選擇,百川智能CEO王小川在微信群中表示,開源和閉源并不像手機中IOS或者安卓操作系統(tǒng)只能二選一,開源確實容易“建立人品”,“朋友多多的”,也是為商業(yè)化做準(zhǔn)備。從To B角度,開源閉源其實都需要。未來80%的企業(yè)會用到開源的大模型,因為閉源沒有辦法對產(chǎn)品做更好地適配,或者成本特別高,閉源可以給剩下的20%提供服務(wù)。二者不是競爭關(guān)系,而是在不同產(chǎn)品中互補的關(guān)系。
近日在各大AI相關(guān)的論壇上,投資人、行業(yè)從業(yè)者也針對開源和閉源的問題展開了“辯論”。生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝在4月18日舉行的“2024中國生成式AI大會”上,認為開源和閉源各有合適的商業(yè)路徑,開源的最大價值在于生態(tài)建設(shè),但從模型能力提升來看,閉源還是會走在開源前面。
啟明創(chuàng)投合伙人周志峰則認為,“開源閉源在過去幾個大浪潮當(dāng)中沒有很大的沖突,我不太理解為什么很多人愿意把閉源、開源在AI時代看成對立”。但他也提到,從技術(shù)角度,開源模型及背后的公司更容易統(tǒng)一資源訓(xùn)練出符合“Scaling Laws”的模型。
昆侖萬維董事長方漢的觀點是,開源模型與閉源模型之間的差距正在不斷縮小。4月16日,方漢在接受媒體采訪時表示:“閉源模型的確(是)第一,但是開源大模型的接近程度在2023年到今年這一年間,從落后兩年以上,已經(jīng)進化到落后4—6個月以上。”
綜合自百度、360、每日經(jīng)濟新聞、第一財經(jīng)等。