今天,在人工智能的推動下,企業數智化轉型已進入規模化“倍增創新”的階段,尤其是AI技術的加速演進,以及應用場景的不斷拓展加深,都讓各類AI創新應用如雨后春筍般涌現,并加速惠及千行萬業。
但與此同時,AI的火熱態勢,也引爆了智能算力的需求。根據中國信通院發布的《中國算力發展指數白皮書(2023年)》顯示,在目前的算力規模中,通用算力規模占比達74%,智能算力規模占比達25%,同比增加60%,成為當前算力快速增長的驅動力,而預計未來幾年,智能算力的需求將比當前呈現上百倍的增長。
也正因此,企業如何根據業務場景和計算任務選擇最適合的算力方案,如何提升數據中心的整體能效,都讓算力基礎設施迎來了全新的挑戰。
不僅如此,根據戴爾科技最新的“創新催化劑”研究顯示,35%的受訪企業認為在持續創新的路上缺乏專業人士指導,更有45%的受訪企業認為在AI時代下,亟需能夠幫助其建議、實施、培訓和擴展AI到數據中的服務,以提高效率和運營。從這個角度來說,企業在AI部署、數智化轉型的道路上,其面對的挑戰和難題不僅僅在于技術方面的“硬實力”,也有包含專業的數字化人才、經驗豐富的服務部署支持等“軟實力”。
正是洞察到這種全新的變化,戴爾科技積極推動算力基礎設施產品和解決方案的技術創新,通過打造“AI First端到端全棧AI平臺解決方案”,最大化幫助企業的現代化數據中心能夠釋放AI的全部潛力。
在此基礎上,近期戴爾科技還在中國市場正式官宣上市全新的AI加速服務器PowerEdge XE9680,提供8個NVIDIA SXM5 500W GPU與NVLink完全互連。這是一款專為需要高性能以及應對新興復雜AI工作負載而構建的服務器系統,具有高性能、洞察驅動和智能化等特點,真正為AI時代大模型訓練和推理構建出了穩定高效的基礎設施“算力底座”。
并且,戴爾科技還提供包括AI數據中心服務部署保障與綠色節能實現,由此不僅為更多中國企業的數智化轉型提供了堅實可靠的技術支撐,相信也將會更快地打通AI落地行業的“最后一公里”,可以說其價值重要而深遠。
AI First全棧解決方案就緒
根據IDC《2024 AIGC應用層十大趨勢白皮書》的數據顯示,隨著AIGC技術的發展,智能化應用將呈現爆發式增長,并預測到2024年全球將涌現出超過5億個新應用,這相當于過去40年間出現的應用數總和,可以說無論是企業還是產業的智能化規模化創新,其本質就是AI應用的擴張,而背后則是需要AI算力和AI基礎設施提供關鍵技術支撐。
對此,戴爾科技集團信息基礎架構解決方案事業部AI企業技術架構師、全球CTO大使吳躍表示,一直以來戴爾科技就秉承“AI First”戰略,從“AI賦能戴爾產品、戴爾產品組合賦能AI、用AI優化企業運營、構建開放的AI生態”四個維度,幫助各種規模的企業加速AI創新的方法,從而不斷發現創造商業機會,保持競爭優勢。
其中,針對AI優化的基礎架構方面,戴爾科技圍繞“算、網、存、管”提供整體參考架構,打造并全面布局了“端到端全棧AI平臺解決方案”,最終為企業用戶構建高效能的AI平臺,具體而言:
01 “算”
在“算”方面,戴爾科技可提供多元化的AI加速計算選型支持,特別是戴爾新一代PowerEdge,先后推出了多款專門針對GPU計算設計和優化的專業服務器,可為企業提供GPU分布式訓練解決方案、GPU池化解決方案以及邊緣AI計算解決方案等,支持企業面向AI的端到端訓練、微調、推理以及面向傳統AI(如機器視覺、語音識別)的模型訓練及推理場景。
此外,在高性能CPU計算服務器方面,戴爾科技也提供包括集群管理、登錄、數據治理等能力。
02 “網”
在“網”方面,隨著數據量的增加,現代化數據中心需要更高的數據吞吐量和網絡帶寬來處理數據的傳輸和交換,為此戴爾科技也提供端到端400GbE AI計算網絡解決方案,幫助企業用戶打造新一代網絡基礎架構,為其加速AI轉型提供支撐。
03 “存”
在“存”方面,戴爾科技推出了專為AI打造的新一代PowerScale全閃存節點,這是全球首個率先通過NVIDIA SuperPOD驗證的AI以太網存儲平臺,借助這個全新的平臺,企業可以加快創新速度,以更高的靈活性和安全性部署AI應用,同時利用高速的NVIDIA Spectrum以太網技術加速數據訪問并借助智能橫向擴展實現性能最大化。
04 “管”
最后,在“管”方面,戴爾科技也提供AI智算平臺軟件解決方案,為企業提供AI框架與系統管理軟件以及專業服務,更好地加速AI工程化、場景化落地,簡化AI基礎設施平臺的管理與資源調配。
不難看出,在全社會走向智能化的大趨勢下,AI應用領域的多樣化,以及市場規模的不斷擴大,已對AI算力和AI基礎構架產生了巨大需求,而戴爾科技圍繞“算、網、存、管”的需求,打造“端到端全棧AI平臺解決方案”可謂“正當其時”,不僅可以加速AI在千行萬業中的落地,也能進一步推動各企業乃至整個行業的數智化變革進程。
AI加速服務器“煥新上市”
眾所周知,在AI的1.0時代,市場上的AI基礎設施主要是采用垂直一體式的方案,針對性地滿足高性能計算、人工智能、大數據計算等不同的應用負載的需求,其通用性和兼容性比較低;而在AI的2.0時代,除了需要滿足高性能、安全及可管理性之外,也出現了多元異構加速融合的趨勢,即將不同架構的芯片平臺、不同的算法模型以及數據集最大化融合,由此才能最大化的讓AI基礎設施算力效率發揮到極致。
基于此,戴爾科技近期也在中國市場官宣上市面向AI 2.0時代的全新AI計算平臺PowerEdge XE9680,這是一款8路GPU服務器,能夠為包括AI、深度學習、訓練和推理等工作負載提供極致的性能。
據戴爾科技集團大中華區服務器解決方案產品高級經理秦建豐介紹,PowerEdge XE9680具有四大獨特優勢,具體而言:
?首先,在高性能方面,PowerEdge XE9680服務器主要面向極致AI計算性能需求場景設計。在國內和香港市場,在XE9680 6U的空間內搭載了8塊NVIDIA超高速GPU,同時還通過NVLink實現了互聯,其GPU與高速網卡實現了1:1配比。
事實上,此前在業內權威的MLPerf Inference V3.1推理基準測試結果中,PowerEdge XE9680服務器就在20個數據中心項目賽道中,取得了7個項目的第一名,在所有參評GPU服務器產品中綜合成績最佳。
?其次,在優化設計方面,PowerEdge XE9680服務器也針對GPU供電和散熱進行了單獨的優化,其基于6U風冷設計機箱打造,并提供了包括多矢量散熱技術,動態調節冷卻風強度等全新功能。
并且,PowerEdge XE9680實現了GPU與CPU模組“統一供電”,同時還對電源進行優化、增強設計,滿足實際使用中峰值功率瞬時140%~170%的需求。此外其高速網卡槽位布置于前面板,也有效強化了服務器的散熱性能。
?第三,在多元異構加速方面,PowerEdge XE9680服務器支持多元異構加速能力,特別是本次戴爾科技和NVIDIA深度合作,打造了“PowerEdge XE9680 + NVIDIA GPU”的方案,就全面滿足了企業AI訓練、微調、推理等不同的應用需求。
此外戴爾科技也基于NVIDIA全棧AI解決方案,包括GPU、DPU和NVIDIA AI Enterprise軟件套件等,進一步滿足企業的AI應用需求。數據也顯示,與上一代非加速服務器相比,通過NVIDIA加速的PowerEdge服務器在大型語言模型上的推理能效提高了300倍。
?最后,在安全及可管理性方面,PowerEdge XE9680服務器也基于“零信任”原則設計,具備更強的安全性和抗風險能力,并在管理方面,其內置的iDRAC也可以動態監控GPU的運行狀態,提供碳足跡追蹤報告等。
PowerEdge XE9680服務器的典型應用場景包括AI模型的預訓練、AI模型的微調、較大規模AI模型的推理,以及基于單精度(FP32)GPU加速科學計算等;而對于主流的訓練、推理以及其他混合工作負載,戴爾科技也提供可以搭載GPU的服務器,如PowerEdge R760xa、R760、R660、R7625、R6625等,也能滿足不同企業用戶對AI應用創新的需求。
打通AI落地“最后一公里”
《系統論》認為:系統是由一些相互關聯、相互作用、相互影響的組織部分構成并具有某些功能的整體。從系統的角度來看,如果把系統分解為部分,單獨研究一個部分,就算把每個部分都研究清楚了,也回答不了系統整體性問題。
事實上,《系統論》的概念很好的表達了當前AI發展邏輯:整個AI的發展乃是一個完整的系統和生態,它的每一個組成部分都應該協同發展,單獨某一項技術的突飛猛進,并不能推動AI的落地與普及。
在戴爾科技集團數據中心業務部人工智能資深架構師龔小愿看來,對于今天的企業用戶而言,AI時代的到來,給數據中心安全高效運行的基AI礎設施和冷卻系統都帶來更大的壓力。
以“PowerEdge XE9680 6U 3+3 8400W”對比“PowerEdge R760*3 6U 1+1 5400W”來看,其功耗提高56%+,同時重量也提高22%+,這也意味著在整個AI基礎設施的部署過程中,無論是功耗、散熱量、制冷量需求、重量乃至“每U購買成本”都會顯著增加,因此如何將綠色節能和降本增效統籌并舉,是企業在部署AI基礎設施中務必要關注的話題。
為此,戴爾科技也專門打造了“PowerEdge XE9680+Datacenter交付”的創新服務方案,提供包括Dell ProDeploy/ProDeploy Plus專業實施服務以 及Dell Rack Integration機柜集成服務,為企業部署AI基礎設施提供“保駕護航”。
?在專業實施服務方面,戴爾科技可向企業用戶提供實用的硬件和軟件選擇,并通過多種交付選項來滿足不同預算和運營模式需求,可滿足從核心到云再到邊緣的各種業務需求和預算。
研究數據顯示,使用Dell ProDeploy Plus服務,其部署規劃時間可縮短67%,能夠幫助企業節省大量的預部署時間并節省總體時間,同時部署解決方案的速度比管理員快三倍。
?在機柜集成服務方面,PowerEdge XE9680也提供“交鑰匙”的機柜集成服務,其優勢不僅在于可實現“即插即用,提升體驗”,同時機柜集成空間也優于傳統的功能型的數據中心,每周平均能夠集成25臺機柜,并能根據企業客戶需求隨時擴大產能。
關鍵的是,采用這種機柜集成服務,也能避免不同的現場施工團隊采用不一致的施工、配置及質量標準,由此大幅度提升PowerEdge XE9680部署安裝效率,并有效降低“每U購買成本”。
結 語
在AI新時代,戴爾科技提供的“端到端全棧AI平臺解決方案”如同一艘“航空母艦”,不僅能夠幫助企業構筑健壯的AI基礎設施,同時也能夠借助“PowerEdge XE9680+Datacenter交付”等創新方式,突破硬件、軟件、算力、算法和數據的局限,加快企業AI基礎設施的安裝和部署,真正打通行業AI落地的“最后一公里”,讓更多的企業可以借助AI激發新質生產力,最終推動中國數字經濟高質量發展。