日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

來源:半導體業觀察

最近,人工智能領域權威跑分榜單MLPerf更新了1.1版,主要針對云端和邊緣端的推理性能。

MLPerf是由ML Commons推出的性能測試榜單。在人工智能技術發展迅速的今天,不同的針對人工智能加速的芯片也是層出不窮,于是如何能有一個較好的標準跑分(benchmark)平臺就很重要,有了這樣的平臺,用戶才能以較為公平和合理的方式去比較不同芯片的人工智能性能。具體來說,MLPerf對于不同的測試組別(訓練,服務器推理,終端推理等)提供了一系列標準的測試網絡,并且由各個硬件公司上傳可驗證的跑分結果,這些結果在經過驗證后,就由ML Commons總結整理并上傳到MLPerf的榜單上。

這次公布的MLPerf 1.1榜單中,基本可以分為幾大勢力:首先,是以Nvidia的GPU為核心加速卡的方案,由各種不同的廠商(包括Nvidia自己,以及超微、聯想、戴爾、HP等整機廠商)實現的整機去跑分;其次是高通的云端加速卡方案,由高通自己提交跑分結果;第三類是Intel的CPU方案;第四類則是一些初創公司的方案。因此,在MLPerf 1.1的結果中,我們認為最值得關注的,就是高通與Nvidia之間的競爭。事實上,在一些測評項目中,高通的方案已經實現了比Nvidia更高的結果,這也說明在服務器推理市場,Nvidia遇到了一個強力的競爭對手,未來無法再高枕無憂。

MLPerf:高通與Nvidia的競爭

目前,Nvidia這一代的主要人工智能加速方案包括A100和A30。其中,A100是Nvidia的旗艦級GPU,同時針對推理和訓練市場,算力高達600 TOPS (INT8精度),其功耗則根據使用內存的區別從250W-400W不等。

另一方面,A30則是Nvidia主要針對推理市場的GPU產品,其INT8峰值算力可達330 TOPS,約為A100的一半,而Nvidia在其官方資料中稱A30在運行機器學習算法時的實際性能約為A100的三分之二。功耗方面,A30的最大功耗約為165W。

在高通方面,Cloud AI 100芯片于今年上半年正式發貨,其INT8最大算力可達400 TOPS,最大功耗(PCIe版本)則75W。根據高通公布的資料,其設計采用了多核架構,每個AI Core上擁有8MB的SRAM,最多在芯片上可以集成16個AI Core,并且這些AI Core會共享LPDDR4X DRAM,以及PCIe接口。值得注意的是,高通的Cloud AI 100并沒有像Nvidia一樣使用HBM2內存接口,而是使用了功耗和帶寬都更低的LPDDR4X接口,這意味著高通需要能更好地管理內存才能擺脫其在內存帶寬方面的劣勢。

高通Cloud AI 100架構

高通Cloud AI 100架構

在MLPerf 1.1中,高通的表現可圈可點。在推理分類下的各項目中,高通提交了ResNet 50(用于圖像分類),SSD(用于物體檢測)以及BERT(用于自然語言處理任務)的結果。在ResNet 50的結果中,高通裝有16塊75W Cloud AI 100 加速卡的主機可以實現每秒342011次推理,而Nvidia提交的DGX主機結果中(包含8塊400W的A100 GPU),ResNet 50的推理吞吐量為每秒313516次推理,因此高通不僅推理吞吐量比Nvidia的旗艦GPU A100結果高了10%,而且總功耗僅為Nvidia方案的三分之一左右。在和Nvidia A30的對比中,高通的Cloud AI 100同樣可以以A30一半左右的功耗實現比A30高10%左右的ResNet 50推理吞吐量。

另一方面,在目標檢測SSD方面,高通16X Cloud AI 100的性能則比Nvidia 8X A100低了10%左右。而在自然語言BERT項目中,高通16X Cloud AI 100的性能則大約是Nvidia 8X A100的一半。這些結果表明,在主流機器視覺任務中,高通的16X Cloud AI 100已經能實現和Nvidia 8X A100基本相同甚至更好的性能,而在BERT等自然語言處理任務中,Cloud AI 100則仍然距離A100有相當的差距。這其實從高通Cloud AI 100的設計中也可以看出端倪,它使用8MB每核心的片上內存搭配LPDDR4X內存接口,在模型較小的機器視覺任務(例如ResNet-50和SSD)中已經夠用,內存不會成為其瓶頸;然而對于模型較大的自然語言處理模型如BERT中,LPDDR4X接口仍然成為了高通AI Cloud 100的瓶頸,而使用HBM2系列接口的Nvidia A100則有優勢。

推理市場中,高通對Nvidia會造成威脅嗎

如前所述,高通的Cloud AI 100在機器視覺任務中都能以更低的功耗實現和Nvidia A100方案接近,或比A30更高的性能。雖然Cloud AI 100在自然語言處理方面離Nvidia A100方案的性能有一些差距(能效比上仍然是Cloud AI 100更好),但是目前在推理方面,事實上機器視覺已經是一塊巨大的市場,因此高通在這個領域有可能會成為強而有力的競爭者。

如果我們細數機器視覺領域對于推理性能有較強需求的領域,首當其沖的可能就是自動和輔助駕駛領域。在自動和輔助駕駛領域,需要大量的目標檢測,這就需要大量的機器視覺算力支持。高通的Cloud AI 100擁有更好的能效比和相當的性能,加上其成本預計會遠遠低于基于HBM2內存的A100 GPU,因此可能會與Nvidia在這個領域有激烈的競爭。自動駕駛領域擁有較高的質控和渠道壁壘,而高通作為在半導體供應鏈中已經有非常深厚積累的巨頭,在這個領域顯然要比其他做自動駕駛芯片的初創公司更有競爭力,因此可能會給這個領域帶來新的市場格局。當然,在自動駕駛領域高通即使能戰勝Nvidia,也不代表高通能占領整個自動駕駛市場:隨著目前各大智能駕駛公司都紛紛開始自研芯片,未來自動駕駛市場中究竟是第三方芯片方案還是第一方芯片方案更是主流,仍然有待觀察。

除了智能駕駛之外,另一個重要的推理市場是智能終端,例如工業機器人和智能攝像頭。這些領域對于功耗和能效比都有較強的需求。高通顯然在設計芯片的時候將這些市場納入了考慮,因此Cloud AI 100除了功耗75W,400TOPS算力的PCIe版本之外,還有功耗15W,算力70 TOPS和功耗25W,算力200 TOPS的低功耗版本,這些版本非常適合工業機器人和智能攝像頭應用。而Nvidia同樣針對該市場的Xavier系列芯片的能效比則遠遜于Cloud AI 100,因此高通在這個領域也有優勢。

當然,高通即使能在競爭中勝過Nvidia,也未必能真正主導這個市場。人工智能推理的一大市場,即中國市場,在國際形勢和國內對于半導體產業大力扶持的背景下,究竟會使用外國公司的方案,還是使用國內公司的方案,對于高通究竟能在這個市場中占有多大份額也有很大影響。

訓練市場如何戰勝Nvidia

在人工智能訓練市場,從MLPerf早些公布的訓練跑分結果我們可以看到,Nvidia的單卡性能仍然遠遠領先Graphcore,Habana等競爭對手。另外,高通似乎目前尚沒有公布在這個領域的計劃。然而,在分布式訓練結果中,我們可以看到Nvidia的訓練跑分結果和谷歌的TPU類似。分布式訓練結果主要考慮如何通過大規模的分布式計算來實現訓練速度的提升,它一個系統工程,需要軟件、網絡通訊和加速卡芯片的協同設計才能實現最佳性能。雖然Nvidia的單卡性能仍然很強,但是在訓練領域,分布式訓練性能事實上甚至比單卡性能更有意義,因此需要很強的系統工程能力才能實現超越。

當然,從另一個角度來說,由于這是一個系統工程,因此如果公司在系統中的其他組件有優勢的話,可以彌補芯片方面的短板。例如,谷歌的芯片部門雖然成立時間遠少于Nvidia,但是憑借其在系統工程領域的深厚積累,可以在分布式訓練領域實現和Nvidia接近的結果。此外,來自北大和鵬城實驗室基于華為Kunpeng CPU+Ascend加速卡+mindspore軟件框架的分布式訓練結果也值得肯定,在自然語言處理領域,BERT訓練結果的跑分華為Ascend 128卡的結果與介于64卡Nvidia A100和64卡TPU之間,而在機器視覺領域,Ascend 1024卡的結果與A100 1024卡的結果接近。因此,在可使用的芯片工藝收到限制的情況下,中國芯片公司考慮從系統工程的角度(例如,通過與該領域有深厚積累的各大IT公司合作)來實現對于Nvidia GPU在訓練領域的趕超或許是一個可行的思路。

分享到:
標簽:英偉 競爭對手 迎來 最強 數碼
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定