美國東部時間12月1日,國際權威AI基準測試MLPerf™公布最新一期訓練(Training)榜單V1.1。浪潮信息提交了AI服務器所有8項單機測試的固定任務(Closed Division)成績,并斬獲其中7項冠軍。
MLPerf™是影響力最廣的國際AI性能基準評測,本次測試吸引谷歌、微軟云、英偉達、浪潮信息、百度、戴爾、聯想等14家公司及科研機構參與,共提交180項固定任務成績,6項開放任務成績。固定任務要求參賽各方使用與參考模型等價的模型和限定的優化器,對于實際用戶評測AI計算系統性能具備很強的參考意義,也一直是MLPerf™中角逐最激烈及主流廠商最關注的領域。
本次性能基準評測涵蓋了8類極具代表性的機器學習任務,分別為圖像分類(ResNet)、醫學影像分割(U-Net3D)、目標物體檢測(SSD)、目標物體檢測(Mask R-CNN)、語音識別(RNNT)、自然語言理解(BERT)、智能推薦(DLRM)以及強化學習(MiniGo)。
浪潮AI服務器在單機系統測試的全部8項固定任務中,獲得7項冠軍。其中,AI服務器NF5688M6獲得醫學影像分割、目標物體檢測(Mask R-CNN)、自然語言理解、智能推薦4項冠軍;AI服務器NF5488A5獲得圖像分類、目標物體檢測(SSD)、語音識別3項冠軍。
全棧AI能力 引領AI訓練速度突破
憑借卓異的軟硬件系統優化能力,浪潮AI服務器將MLPerf™訓練基準的單機效率進一步提升至新的高度。相比半年前的MLPerf™ AI訓練榜單V1.0,浪潮AI服務器將醫學影像識別、語音識別、智能推薦和自然語言處理任務的單機AI訓練速度提升18%、14%、11%和8%。
MLPerf™作為國際最權威的AI性能基準測試,不斷刷新業內的AI訓練速度。目前,浪潮信息是MLPerf™基準測試中醫學影像分割、目標物體檢測(Mask R-CNN)、自然語言理解、智能推薦、圖像分類、目標物體檢測(SSD)、語音識別7項AI任務的單機最快訓練速度保持者。浪潮AI服務器在圖像分類訓練中每秒可處理27400張圖片、在目標物體檢測訓練中每秒可處理12600張圖片、在語音識別訓練中每秒可處理8000段語音,引領全球AI訓練速度突破,凸顯出頂級AI服務器在AI模型訓練效率上的巨大價值。
浪潮AI服務器在MLPerf™基準評測中的出色表現,得益于在AI計算系統創新上卓越的系統設計能力和全棧優化能力。在硬件層面,針對AI訓練中常見的密集IO傳輸瓶頸,浪潮AI服務器以領先設計大幅降低通信延遲,極大提升了AI訓練效率;同時,針對高負載多GPU協同任務調度,對NUMA節點與GPU之間的數據傳輸進行全面優化和深度調校,確保訓練任務中的數據IO無阻塞;在散熱層面,針對目前業界功率最高的A100-SXM-80GB(500W) GPU,浪潮率先開發的先進冷板液冷系統,確保GPU在全功率甚負載下依然穩定工作,將AI計算系統的性能發揮到極致。
MLPerf™ 2021年度收官 浪潮信息共獲44項第一
MLCommons每年組織2次MLPerf™ 推理性能測試和2次MLPerf™ 訓練性能測試。本次成績公布意味著MLPerf™ 2021年度4次性能測試正式收官。浪潮AI服務器共斬獲44項第一,名列MLPerfTM2021年度冠軍榜首。
2021年,浪潮AI服務器在MLPerfTM數據中心AI推理場景的總32項任務中斬獲17項冠軍,在邊緣AI推理場景的總31項任務中斬獲16項冠軍,從云到邊全面領先;在單機AI訓練場景的16項任務中浪潮AI服務器共斬獲11項冠軍。
2021年,浪潮AI服務器NF5488A5、NF5688M6以及邊緣服務器NE5260M5參加到MLPerfTM競賽中,各斬獲18項、15項及11項冠軍。
NF5488A5是全球首批上市的A100服務器,在4U空間支持8顆第三代NVLink互聯的A100 GPU和2顆AMD Milan CPU,同時支持液冷和風冷散熱技術。NF5688M6是面向大規模數據中心優化設計的具備極致擴展能力的AI服務器,支持8顆A100 GPU和兩顆Intel Ice Lake CPU,支持多達13張PCIe Gen4的IO擴展卡。NE5260M5通過極致優化的信號和電源等系統設計,兼容高性能CPU和多種AI加速卡,通過減震降噪優化和嚴苛的可靠性測試,機箱深度430mm較普通服務器縮短近二分之一,滿足空間受限的邊緣計算場景部署需求。
浪潮信息是全球領先的AI計算廠商,AI服務器市場份額全球第一,中國市場份額已連續五年穩居第一。浪潮信息致力于AI計算平臺、資源平臺和算法平臺的研發創新,并通過元腦生態與AI領先企業共同推進AI產業化和產業AI化進程。