算力江湖,硝煙四起。
在生成式AI和大模型浪潮席卷全球之下,英偉達憑借前瞻的戰(zhàn)略布局、先進的產(chǎn)品組合和多年的生態(tài)積累,幾乎成為人工智能GPU的唯一選擇,因而推動其市值一度大幅上揚沖破萬億美元。盡管多家科技巨頭、初創(chuàng)公司紛紛加碼這一領(lǐng)域,但英偉達一直未棋逢對手。
但如今,英偉達或已無法高枕無憂。近日,AMD在美國舊金山舉辦的“數(shù)據(jù)中心和人工智能技術(shù)首映式”活動上,正式發(fā)布MI300系列在內(nèi)的一系列AI和數(shù)據(jù)中心相關(guān)技術(shù)產(chǎn)品,其中包括直接對標英偉達旗艦產(chǎn)品H100的MI 300X,以及全球首款針對AI和HPC的加速處理器(APU)MI300A。這意味著AMD將在人工智能領(lǐng)域與英偉達“正面剛”。
在業(yè)界看來,硬剛英偉達,AMD無疑在獲取客戶,數(shù)據(jù)和庫、硬件加速和生態(tài)建設(shè)等方面面臨重要挑戰(zhàn),以及在當前的行業(yè)發(fā)展和競爭格局下,其尚未公布的定價將成為戰(zhàn)略重點。但在旺盛的市場需求和科技巨頭多元布局戰(zhàn)略下,AMD MI 300X憑借性能優(yōu)勢以及系列相關(guān)建構(gòu)升級,勢必將成為AI市場的有力競爭者,以及英偉達高端GPU的重要替代產(chǎn)品。
硬剛競品 力創(chuàng)新機
隨著AI浪潮席卷全球,AMD已將發(fā)展人工智能列為核心戰(zhàn)略,在技術(shù)創(chuàng)新高地保持強力攻勢,并于近日推出了新一代AI芯片、數(shù)據(jù)中心CPU以及預(yù)告將推出全新DPU芯片。顯然,其中最受矚目的莫過于用于訓(xùn)練大模型的AI芯片Instinct MI 300X,直接對標英偉高端GPU H100。至于另一款同期發(fā)布的MI300A,號稱全球首款針對AI和HPC的APU,以及業(yè)界首款“CPU+GPU+HBM顯存”一體化的數(shù)據(jù)中心芯片。
一些分析機構(gòu)和行業(yè)人士研判認為,MI300X性能強大,是對標英偉達高端加速卡的有力競品。相較H100,MI300X在晶體管數(shù)量和顯存容量上亦大幅領(lǐng)先。而MI300A憑借CPU+GPU的能力,產(chǎn)品組合性能更高、同時具有成本優(yōu)勢。另外,在收購賽靈思之后,AMD在加速卡領(lǐng)域的定制化服務(wù)大幅領(lǐng)先英偉達,能夠協(xié)助云廠商在特定算法模塊上進行訓(xùn)練。
隨著下游應(yīng)用端的高速發(fā)展,使得微軟、谷歌、Meta等眾多海外巨頭爭相增加算力儲備,算力芯片需求高度旺盛之下,英偉達一家獨大的市場格局或?qū)⒂瓉磙D(zhuǎn)變。
但有所遺憾的是,AMD股價在發(fā)布會活動過程中轉(zhuǎn)而走低,收跌3.61%。而同行英偉達則收漲3.90%,市值再次收于1萬億美元關(guān)口上方。在投資人眼里,AMD的所謂“超級芯片”MI300X似乎仍然難以撼動英偉達的根基。其中,TIRIAS Research首席分析師Kevin Krewell表示:“我認為,沒有(大客戶)表示將使用MI300X或MI300A,這可能會讓華爾街感到失望。他們希望AMD宣布已經(jīng)在某些設(shè)計方面取代了英偉達。”
目前,AMD公布的客戶僅有開源大模型獨角獸Hugging Face,以及更早之前透露的勞倫斯利弗莫爾國家實驗室。雖然兩者與對大模型和數(shù)據(jù)中心芯片有更大需求的科技巨頭不在一個數(shù)量級,但在AMD的發(fā)布會上值得注意的是,亞馬遜旗下云計算部門AWS、甲骨文云、Meta、微軟Azure的高管均來到現(xiàn)場。其參會動機一定程度上不言而明。
此后,由于傳出亞馬遜正在考慮使用MI300人工智能芯片,AMD股價隨即上漲約1%。Insider Intelligence分析師Jacob Bourne表示:“亞馬遜正在考慮AMD的MI300,這一事實表明科技公司有意使其AI開發(fā)硬件多樣化,這可能會為其他芯片制造商創(chuàng)造新的機會。”
美國科技類評論家Billy Duberstein也指出,潛在客戶對MI300非常感興趣,正在強烈要求尋找英偉達的替代產(chǎn)品。鑒于目前英偉達H100的服務(wù)器價格高昂,數(shù)據(jù)中心運營商希望看到有一個第三方競爭對手,這有助于降低AI芯片的價格。因此,這對AMD而言是一個巨大的優(yōu)勢,對英偉達來說則是一個挑戰(zhàn)。這能為每個市場參與者帶來良好的盈利能力。
尚有軟肋 定價是“金”
從產(chǎn)品性能來看,AMD MI 300X已在業(yè)界力拔頭籌,包括支持達192GB的HBM3內(nèi)存(是英偉達H100的2.4倍),HBM內(nèi)存帶寬達5.2TB/s(是英偉達H100的1.6倍),Infinity Fabric總線帶寬為896GB/s,晶體管數(shù)量達到1530億個,遠高英偉達H100的800億個。但AMD并沒有公布這款GPU的價格,使得“雙雄”競爭增加了懸念。
AMD MI 300處理器
業(yè)界分析稱,AMD并沒有透露新款A(yù)I芯片的具體售價,但想要有顯著的成本優(yōu)勢可能不太現(xiàn)實,因為高密度的HBM價格昂貴。即便MI300X的內(nèi)存達到了192GB,但這也不是顯著優(yōu)勢,因為英偉達也擁有相同內(nèi)存規(guī)格的產(chǎn)品。
對此,Cambrian-AI Research LLC創(chuàng)始人兼首席分析師Karl Freund也在福布斯網(wǎng)站上發(fā)文表示,雖然MI300X芯片提供了192GB內(nèi)存,但英偉達在這一點上將很快迎頭趕上,甚至在相同的時間框架內(nèi)可能實現(xiàn)反超,所以這并不是一個很大的優(yōu)勢。而且MI300X的售價將會十分高昂,與英偉達的H100相比不會有明顯的成本優(yōu)勢。
另據(jù)晚點LatePost援引一位AI從業(yè)者的話報道稱,他所在的公司曾接觸一家非英偉達GPU廠商,對方的芯片和服務(wù)報價比英偉達更低,也承諾提供更及時的服務(wù)。但他們判斷使用其它GPU的整體訓(xùn)練和開發(fā)成本會高于英偉達,還得承擔結(jié)果的不確定性和花更多時間。
“雖然A100價格貴,但其實用起來是最便宜的。”他說,對有意抓住大模型機會的大型科技公司和頭部創(chuàng)業(yè)公司來說,錢往往不是問題,時間才是更寶貴的資源。
不難猜測,這家非“英偉達GPU廠商”是AMD的可能性極高。由此,在AI浪潮下,爭市場還是保盈利,將成為MI 300X屆時定價的戰(zhàn)略重點。但除了價格,AMD勢必也面臨其它各類挑戰(zhàn)。
Karl Freund認為,雖然AMD新推出的MI 300X芯片激起了市場各方的巨大興趣,但與英偉達的H100芯片相比面臨的一些挑戰(zhàn)包括,英偉達的H100現(xiàn)在已開始全面出貨,而且到目前為止仍擁有AI行業(yè)最大的軟件和研究人員生態(tài)系統(tǒng)。然而,AMD尚未披露任何基準測試,也還沒有上市(預(yù)計今年第四季度量產(chǎn))。另外,訓(xùn)練和運行大語言模型(LLM)時的性能取決于系統(tǒng)設(shè)計和GPU,MI 300X正式推出時才能看到一些詳細比較。
至于真正關(guān)鍵的地方,Karl Freund指出,MI300X并不具備H100所擁有的Transformer Engine(一個用于在英偉達GPU上加速Transformer模型的庫)。基于此,H100可以將大模型的性能提高兩倍。如果用幾千個(英偉達的)GPU來訓(xùn)練一個新模型需要一年的時間,那么用AMD的硬件來訓(xùn)練可能需要再等2-3年,或者投入3倍的GPU來解決問題。
可即便如此,市場也不愿意英偉達以高溢價壟斷市場。美國投行TD Cowen在一份報告中指出,“隨著市場尋找人工智能市場領(lǐng)軍企業(yè)英偉達的替代品,AMD成為日益明顯的選擇。”僅憑這一點,就足以讓科技巨頭保持對這家公司的高度興趣。正因如此,資本市場對于AMD給予更多積極的預(yù)期。部分行業(yè)分析預(yù)測,AMD2024年AI相關(guān)營收有望達到4億美元,最高甚至可能達到12億美元——是此前預(yù)期的12倍之多。
生態(tài)大戰(zhàn) 前程可期
毋庸置疑,與英偉達的H100相比,MI300X也面臨著多種挑戰(zhàn)和一定劣勢。華泰證券表示,AMD對英偉達市場份額的挑戰(zhàn)并非能一蹴而就。一方面,英偉達GPU芯片的算力壁壘以及AI訓(xùn)練端的深入布局一時難以撼動,另一方面,AMD的軟件生態(tài)也限制其與客戶系統(tǒng)的融合及滲透應(yīng)用場景。
可以說,英偉達的領(lǐng)先地位不僅來自于其芯片,還來自于十多年來為人工智能研究人員提供的軟件工具。Moor Insights & Strategy分析師Anshel Sag稱:“即使AMD在硬件性能方面具有競爭力,但人們?nèi)匀徊幌嘈牌滠浖鉀Q方案能與英偉達競爭。”
進一步來看,軟件生態(tài)也被多位行業(yè)人士視為英偉達銅墻鐵壁一般的護城河。
據(jù)悉,英偉達于2007年發(fā)布CUDA生態(tài)系統(tǒng)。通過使用CUDA,開發(fā)者可以將英偉達的GPU用于通用的計算處理,而非僅限于圖形處理。CUDA提供了一個直觀的編程接口,允許開發(fā)者更容易使用C,C++,Python,以及其他一些語言來編寫并行代碼。2023年,CUDA的開發(fā)者已達400萬,包括Adobe等大型企業(yè)客戶。而用戶越多構(gòu)成的生態(tài)粘性就越大。
相比之下,AMD在2016年推出了ROCm,目標是建立可替代英偉達CUDA的生態(tài)。在發(fā)布MI300X等產(chǎn)品時,AMD也展示該公司不斷優(yōu)化ROCm的努力和部分成果。有行業(yè)分析稱,這會對CUDA有一定影響,但是CUDA有自己護城河,比如其和硬件層面非常貼合,還有Compile tool,Soft stake等很多層級的生態(tài)以及一些先天優(yōu)勢。
“但CUDA的護城河已經(jīng)不是那么絕對,因為客戶的上層模型參數(shù)可以不做任何調(diào)整直接從英偉達的卡遷移到AMD上。ROCm能兼容每一個層級Soft stake,也能在保持穩(wěn)定性同時提升性能。很多客戶不想被英偉達深度綁定,所以會選擇AMD。因此,CUDA現(xiàn)在已經(jīng)不像之前那樣堅不可摧。”
上述行業(yè)人士還指出,CUDA會持續(xù)迭代,而如果AMD一直只是做兼容就需要一直緊跟英偉達,一旦跟不上就會很吃虧。長期來看,這對企業(yè)而言肯定不少好事情,需要構(gòu)建自己的長期系統(tǒng)生態(tài),包括與客戶合作開發(fā)Soft stake,軟件,Rocm數(shù)據(jù)和庫,基于AMD MI硬件做加速等。這是AMD需要長期做的事。
客觀而言,與CUDA相比,ROCm在各項投入、技術(shù)積累和生態(tài)構(gòu)建等方面還存在一定差距。華泰證券的研究報告稱:“目前ROCm的不足之處在于操作系統(tǒng)長期只支持Linux,最近才登陸Windows;加上長期只支持高端GPU,如Radeon Pro系列等,直到今年4月才擴展至一些消費級GPU;另外,CUDA在今年達400萬以上的開發(fā)者,也是ROCm無法相比的地方。”
與此同時,報告也指出,AMD目前也正積極拓展ROCm生態(tài)圈,包括支持Windows操作系統(tǒng)、在AI領(lǐng)域開拓更廣泛的框架,如MIOpen和MIVisionX,以及支持TensorFlow、PyTorch等更多軟件。此外,ROCm在進一步通過HIP兼容CUDA同時,也與包括微軟在內(nèi)的客戶等合作重構(gòu)自己的生態(tài)。而這勢必將對英偉達AI芯片的王座形成更強有力挑戰(zhàn)。
【來源:集微網(wǎng)】