【ITBEAR】9月11日消息,隨著人工智能技術(shù)的飛速發(fā)展,AI組網(wǎng)結(jié)構(gòu)的變化趨勢日益成為業(yè)界關(guān)注的焦點。近日,興業(yè)證券發(fā)布了一份題為《AI深度洞察系列報告(三):Scale up與Scale out組網(wǎng)變化趨勢如何看?》的研究報告,深入探討了這一問題及其對算力產(chǎn)業(yè)鏈投資機會的影響。
報告指出,在AI大模型訓(xùn)練領(lǐng)域,分布式并行訓(xùn)練架構(gòu)已成為主流,其中張量并行對通信的要求尤為突出。隨著模型規(guī)模的不斷擴大,服務(wù)器內(nèi)帶寬需求也在迅猛增長。為滿足這一需求,建立更大帶寬的超節(jié)點已成為行業(yè)發(fā)展的必然趨勢。
據(jù)ITBEAR了解,超節(jié)點的規(guī)模設(shè)計正由GPU廠商和云服務(wù)商共同推動。以英偉達(dá)為例,其超節(jié)點規(guī)模在不斷升級,以適應(yīng)日益增長的算力需求。同時,谷歌也在通過擴大超節(jié)點Pod規(guī)模來降低數(shù)據(jù)中心網(wǎng)絡(luò)(DCN)的帶寬要求。此外,UALink聯(lián)盟也在積極推動超節(jié)點規(guī)模的進(jìn)一步提升。
在Scale up方面,除了帶寬提升外,互聯(lián)密度的增加也是一個重要趨勢。英偉達(dá)等廠商正在采用先進(jìn)的互聯(lián)技術(shù),如NVL GB200方案和NVLINK協(xié)議,以提升機柜內(nèi)部的互聯(lián)帶寬。目前,銅互聯(lián)方式仍占主導(dǎo)地位,但長期來看,光互聯(lián)技術(shù)有望取代銅互聯(lián),成為未來的主流互聯(lián)方式。
另一方面,Scale out的發(fā)展則主要體現(xiàn)在集群規(guī)模的擴大上。受Scaling Laws法則的驅(qū)動,AI大模型的硬件部署正朝著更大集群的方向發(fā)展。目前,AI集群規(guī)模已進(jìn)入10萬卡階段,以太網(wǎng)組網(wǎng)在AI集群中的應(yīng)用也正在加速落地。
報告還提到,字節(jié)跳動和meta等科技巨頭已經(jīng)采用以太網(wǎng)技術(shù)來搭建AI集群。同時,博通等廠商也在不斷升級其以太網(wǎng)交換芯片,以滿足不斷增長的市場需求。英偉達(dá)也強調(diào)了以太網(wǎng)方案在AI集群部署中的重要性。
此外,隨著AI集群規(guī)模的擴大,交換機和光模塊等配套設(shè)施的需求也在不斷增加。Arista等公司針對AI需求提出了不同的交換機互聯(lián)方案,通過提升交換機端口數(shù)來推動Scale out規(guī)模的進(jìn)一步提升。同時,光模塊的總需求也與算力需求成正比,保持向上趨勢。硅光技術(shù)有望在未來逐步從可插拔硅光形式過渡到CPO形式,并在1.6T光模塊階段實現(xiàn)滲透率的提升。
綜上所述,AI組網(wǎng)正朝著更大規(guī)模集群的方向發(fā)展,Scale up和Scale out兩大趨勢共同推動了AI算力產(chǎn)業(yè)鏈的不斷進(jìn)步。隨著技術(shù)的不斷創(chuàng)新和市場需求的持續(xù)增長,相關(guān)產(chǎn)業(yè)將迎來更多的投資機會和發(fā)展空間。
#AI組網(wǎng)# #Scale up# #Scale out# #算力產(chǎn)業(yè)鏈# #投資機會#