AI大模型成為風(fēng)口,全球算力供不應(yīng)求。
據(jù)廣發(fā)證券測(cè)算,國(guó)內(nèi)AI大模型在訓(xùn)練與推理階段或產(chǎn)生相當(dāng)于1.1萬(wàn)臺(tái)至3.8萬(wàn)臺(tái)高端AI服務(wù)器的算力需求。以GPU產(chǎn)品售價(jià)10萬(wàn)元、AI加速卡價(jià)值量占服務(wù)器整機(jī)約70%計(jì)算,則對(duì)應(yīng)126億元至434億元增量AI服務(wù)器市場(chǎng)規(guī)模。
在訂單需求激增的情況下,如何部署節(jié)能技術(shù)并兼顧算效、能耗、成本,成為考驗(yàn)數(shù)據(jù)中心建設(shè)與運(yùn)營(yíng)者的關(guān)鍵。在服務(wù)器及IT系統(tǒng)解決方案提供商寧暢主辦的媒體溝通會(huì)上,寧暢公司總裁秦曉寧和業(yè)內(nèi)專(zhuān)家共同探討了此事。
中國(guó)建筑標(biāo)準(zhǔn)設(shè)計(jì)研究院數(shù)據(jù)中心工程部主任吳曉暉表示,數(shù)據(jù)中心降低能耗和成本的的關(guān)鍵,除了合理選址之外,還可以提高能效和優(yōu)化用能。
吳曉暉以一個(gè)PUE是2的數(shù)據(jù)中心案例具體講了能耗構(gòu)成:最大的能耗是IT設(shè)備,占50%,另外的25%+10%是數(shù)據(jù)中心的制冷系統(tǒng),10%+3%是供能系統(tǒng),包括UPS、變壓器等。從能耗構(gòu)成來(lái)看,制冷系統(tǒng)是壓縮潛力最大的。

據(jù)了解,數(shù)據(jù)中心最早的制冷方式是空調(diào)方案,歷經(jīng)房間空調(diào)、背板空調(diào)、行級(jí)空調(diào)幾個(gè)階段,制冷模式從房間大面積吹到把空調(diào)做到機(jī)柜中間,再到現(xiàn)在把空調(diào)做到芯片上。因?yàn)樾酒亲畲蟮闹茻嵩矗评涫侄卧絹?lái)越接近熱源,制冷效率也越來(lái)越高。
但不管是用風(fēng)熱空調(diào)壓縮機(jī)還是用機(jī)組空調(diào),都是用電制冷,需要耗費(fèi)大量能源。隨著數(shù)據(jù)中心的需求激增,更加節(jié)能的室外自然冷卻技術(shù)被更大范圍的應(yīng)用,其中兩個(gè)代表性的技術(shù)是液冷和蒸發(fā)冷卻技術(shù),這讓數(shù)據(jù)中心迎來(lái)降低能耗的新機(jī)遇,但真正讓液冷等技術(shù)落地并不容易。
寧暢總裁秦曉寧表示,當(dāng)前80-90%的數(shù)據(jù)中心依然采用風(fēng)冷散熱,盡管數(shù)據(jù)中心節(jié)能政策頻出,液冷投入成本下降,但液冷升級(jí)中仍存在著多重困難。主要包括技術(shù)難題包含三個(gè)方面:
一是技術(shù)難,風(fēng)轉(zhuǎn)液冷首先要考驗(yàn)包括復(fù)雜部件液冷適配、漏液可靠性等在內(nèi)的綜合技術(shù)。
二是建設(shè)久,液冷升級(jí)涉及樓體、空間改造等多個(gè)環(huán)節(jié),周期長(zhǎng),產(chǎn)業(yè)鏈協(xié)同性較弱。
三是成本高,用戶傾向于關(guān)注初期建設(shè)成本,往往忽略了液冷釋放的性能帶來(lái)的業(yè)務(wù)效益與節(jié)能效果。
秦曉寧表示,大模型火了之后,5月GPU服務(wù)器用量增長(zhǎng)38%,大模型帶來(lái)GPU的功耗是400-700,一個(gè)通用機(jī)柜功耗需要達(dá)到8kW~10kW。如果一個(gè)通用計(jì)算機(jī)柜功耗已經(jīng)達(dá)到了10kW,機(jī)房就必須改造。
吳曉暉表示,無(wú)論是從節(jié)能方面來(lái)看,還是服務(wù)器機(jī)柜功率密度越來(lái)越高的趨勢(shì)看,數(shù)據(jù)中心適合于液冷置換。
目前國(guó)內(nèi)數(shù)據(jù)中心冷卻液技術(shù)處在初期發(fā)展階段,但因?yàn)閿?shù)據(jù)中心需求快速增長(zhǎng),已到了爆發(fā)的前夜。