日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

6月30日,全球權威AI基準評測MLPerf™最新V2.0訓練評測成績榜單公布。浪潮AI服務器表現優異,繼兩月前在MLPerf™ V2.0數據中心推理評測中斬獲全部冠軍后,本次又在MLPerf™ V2.0單機訓練性能繼續保持領先。

本次MLPerf™ 評測吸引了包括谷歌、NVIDIA、浪潮信息、百度、Intel-Habana、Graphcore等全球21家廠商和研究機構參與,共有264項評測成績提交,是上一輪基準評測的1.5倍。評測任務涵蓋了當下主流AI場景,包括自然語言處理(BERT)、智能推薦(DLRM)、圖像分類(ResNet)、醫學影像分割(3D U-Net)、輕量級目標物體檢測(RetinaNet)、重量級目標物體檢測(Mask R-CNN)、語音識別(RNN-T)以及強化學習(Minigo)8類AI任務。

在單機訓練評測的固定任務中,浪潮信息以高端AI服務器斬獲自然語言理解(BERT)、智能推薦(DLRM)、語音識別(RNN-T)三項性能成績第一,位列單機冠軍榜首。在本次配置8顆NVIDIA A100 Tensor Core GPU的主流高端AI服務器中,浪潮AI服務器斬獲5項任務最佳成績(BERT、DLRM、RNN-T、ResNet、Mask R-CNN)。

超越摩爾定律,持續領跑AI計算性能提升

MLPerfTM評測組織機構MLCommons 執行主任 David Kanter 在此次成績發布會上表示,自首次公布評測基準以來,MLPerf性能提升速度遠超過摩爾定律??紤]到業界對計算和AI的需求正以驚人的速度增長,這讓人非常振奮。

自參加MLPerf™ AI性能評測以來,浪潮AI服務器通過軟硬件全面優化,持續實現AI性能突破。相較于2018年12月MLPerf™ 初始版本V0.5的典型配置8卡機型的性能數據,浪潮AI服務器的性能顯示出大幅提升,提升比例最高達789%,2.35倍于摩爾定律增速。

浪潮AI服務器在MLPerf™基準評測中的卓越表現,得益于浪潮信息在AI計算系統上優異的設計創新能力和全棧優化能力。浪潮AI服務器針對AI訓練中常見的密集I/O傳輸瓶頸,通過PCIe retimer-free 設計實現了CPU-GPU間通道免中繼高速互聯,大幅降低通信延遲;并針對高負載多GPU協同任務調度,以及NUMA節點與GPU之間的數據傳輸性能進行了深度優化,確保訓練任務中的數據I/O通路處于最高性能狀態;在散熱層面,率先實現4U空間內部署8顆500W的高端NVIDIA A100 Tensor Core GPU,并支持風冷、液冷兩種散熱方式。同時,在模型訓練全流程中,浪潮AI服務器持續通過優化預訓練數據處理、GPU之間高速通信、GPU核心加速等關鍵模塊,最大化提升了AI模型的訓練性能。

大幅提升Transformer訓練性能

當前,基于Transformer神經網絡的預訓練大模型正引領新一代AI算法發展,并逐步從自然語言處理走向計算機視覺、多模態等領域。MLPerfTM評測任務中的BERT模型即是基于Transformer架構的模型。Transformer簡潔、可堆疊的架構使得開發極大參數量、基于極大數據集的預訓練大模型成為可能,這帶來了模型算法能力的大幅提升,但同時也對AI計算系統的處理性能、通信互聯、I/O性能、并行擴展、拓撲路徑及散熱能力提出了更高的要求。

在本次BERT評測任務中,浪潮AI服務器通過優化數據預處理、GPU之間密集參數通信、超參數自動尋優等,進一步提升了BERT訓練性能,在15.869分鐘內即在Wikipedia數據集的2850176條數據上完成了3.3億參數的BERT模型訓練,相較于V0.7版本的最佳成績49.01分鐘的性能提升達到309%。至此,浪潮AI服務器已經連續三次獲得MLPerfTM訓練BERT任務性能冠軍。

浪潮信息在 MLPerf™ V2.0訓練評測中取得佳績的2款AI服務器分別是NF5488A5及NF5688M6。NF5488A5是全球首批上市的NVIDIA A100 Tensor Core GPU服務器,在4U空間支持8顆 由NVIDIA NVLink 互聯的 NVIDIA A100 Tensor Core GPU和2顆 AMD Milan CPU,同時支持液冷和風冷散熱技術,累計斬獲40項 MLPerf™ 冠軍。NF5688M6是面向大規模數據中心優化設計的具備極致擴展能力的AI服務器,支持8顆第三代 NVLink 互聯的 NVIDIA A100 Tensor Core GPU 和兩顆 Intel Ice Lake CPU,支持多達13張 PCIe Gen4 的IO擴展能力,累計斬獲25項 MLPerf™ 冠軍。

附:MLPerf™簡介

MLPerf™ 是影響力最廣的國際AI性能基準評測,由圖靈獎得主大衛•帕特森(David Patterson)聯合頂尖學術機構發起成立。2020年,非盈利性機器學習開放組織MLCommons基于MLPerf™ 基準測試成立,其成員包括Google、Facebook、NVIDIA、英特爾、浪潮信息、哈佛大學、斯坦福大學、加州大學伯克利分校等50余家全球AI領軍企業及頂尖學術機構,致力于推進機器學習和人工智能標準及衡量指標。目前,MLCommons每年組織2次MLPerf™ AI訓練性能測試和2次MLPerf™ AI推理性能測試,以便快速跟進迅速變化的計算需求和計算性能提升,為用戶衡量設備性能提供權威有效的數據指導。

分享到:
標簽:再創 定律 浪潮 評測 超越 性能 提升 成績
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定