來源:腦極體
經(jīng)常關(guān)注科技圈的朋友們總會發(fā)現(xiàn),每次遇到廠商有重大發(fā)布,就總能看到 " 顛覆 "、" 極致 "、" 革命性 " 等概念出現(xiàn)在發(fā)布會上。
前幾天,iPhone12 的發(fā)布現(xiàn)場,蒂姆庫克就用上了 " 新紀(jì)元 " 的字眼,準(zhǔn)確地說應(yīng)該是 iPhone 正式地步入了 5G 時代新紀(jì)元。但國內(nèi)消費者對 5G 已經(jīng)是見怪不怪了。蘋果自嗨的劃時代產(chǎn)品因為沒有達到市場的預(yù)期,當(dāng)日股價就跌去 3800 億個小目標(biāo),后面就要靠銷量來證明蘋果自己有沒有跨入 " 新紀(jì)元 " 了。
相比較于關(guān)注度高的消費電子領(lǐng)域,本文要把重點放在大多數(shù)人不太熟悉的數(shù)據(jù)中心產(chǎn)業(yè),及其更上游的數(shù)據(jù)中心計算芯片上面。因為我們看到隨著云計算的大規(guī)模普及和 AI 計算的指數(shù)級增長,數(shù)據(jù)中心被提到前所未有的重要位置。
最近在參加一個有關(guān)數(shù)字通信產(chǎn)業(yè)的論壇上,聽到一位中國信通院的專家的觀點是:數(shù)據(jù)中心,將成為和 5G 技術(shù)并肩,下一個數(shù)字技術(shù)的制高點。類似的觀點,我們也在英偉達線上 2020 年 GPU 技術(shù)大會,從黃仁勛那里聽到:數(shù)據(jù)中心已成為全新的計算單元。
黃仁勛之所以有這樣的底氣,就在于這次發(fā)布會上推出了一款全新處理器 DPU,以及圍繞該處理器的軟件生態(tài)架構(gòu) DOCA。據(jù)英偉達的介紹,DPU 可以和 CPU、GPU 相結(jié)合,構(gòu)成完全可編程的單一 AI 計算單元,實現(xiàn)前所未有的安全性和算力支持。
那么,DPU 能否真正承擔(dān)起與 CPU、GPU 一樣的計算重要性,實現(xiàn)數(shù)據(jù)中心的一次巨大革新?其創(chuàng)新點到底在哪里?這些仍然是我們要去回顧和考察的問題。
英偉達 DPU 的過 " 芯 " 之處
從英偉達在 GTC 的介紹上來說,DPU(Data Processing Unit)處理器,其實是一種 SoC 芯片,其中集成了 ARM 處理器核、VLIW 矢量計算引擎和智能網(wǎng)卡的功能,主要應(yīng)用在分布式存儲、網(wǎng)絡(luò)計算和網(wǎng)絡(luò)安全領(lǐng)域。
DPU 的主要作用就在于替代了數(shù)據(jù)中心原本用來處理分布式存儲和網(wǎng)絡(luò)通信的 CPU 處理器資源。在 DPU 之前,智能網(wǎng)卡(SmartNIC)正在網(wǎng)絡(luò)安全和網(wǎng)絡(luò)互連協(xié)議方面逐漸取代 CPU。而現(xiàn)在 DPU 的出現(xiàn),相當(dāng)于是智能網(wǎng)卡的升級替代版本,一方面增強了智能網(wǎng)卡對網(wǎng)絡(luò)安全和網(wǎng)絡(luò)協(xié)議的處理能力,一方面又整合和加強了分布式存儲的處理能力,從而在這兩個領(lǐng)域更好地替代 CPU,從而釋放 CPU 的算力給到其他更多應(yīng)用。
英偉達在 DPU 上的技術(shù)突破,來自于去年收購以色列芯片制造公司 Mellanox 之后,在這家公司的硬件基礎(chǔ)上開發(fā)出 BlueFeild 系列的兩款 DPU ——英偉達 BlueField-2 DPU 與 BlueField-2X DPU。
據(jù)介紹,BlueField-2 DPU 具有英偉達 Mellanox Connext-6 SmartNIC 的所有特點,與 8 個 64 位的 A72ARM 處理器內(nèi)核一起,實現(xiàn)可完全編程,并能提供每秒 200 千兆比特的數(shù)據(jù)傳輸速率,從而加速關(guān)鍵數(shù)據(jù)中心的安全、網(wǎng)絡(luò)和存儲任務(wù)。
最核心的一點是單個 BlueField-2 DPU 可以提供相當(dāng)于消耗 125 個 CPU 內(nèi)核所提供的數(shù)據(jù)中心服務(wù),從而有效釋放 CPU 內(nèi)核的算力資源。
而 BlueField-2X DPU 則擁有包括 BlueField-2 DPU 的所有關(guān)鍵特性,其特性能夠通過英偉達安培 GPU 的 AI 功能得以增強。而在英偉達的路線圖里,未來的 Bluefield-4 將會引入 CUDA 和 NVIDIA AI,極大加快網(wǎng)絡(luò)中計算機視覺應(yīng)用處理的速度。
另外一個值得注意的是英偉達提出配合 DPU 處理器的軟件開發(fā)工具包—— DOCA(Data-Center-Infrastructure-On-A-Chip Architecture)。英偉達的專家將 DOCA 類比為數(shù)據(jù)中心服務(wù)器領(lǐng)域的 CUDA,其意圖在于幫助開發(fā)人員在 DPU 加速的數(shù)據(jù)中心基礎(chǔ)設(shè)施上構(gòu)建相應(yīng)的應(yīng)用程序,從而豐富 DPU 的應(yīng)用開發(fā)生態(tài)。
從以上介紹我們看出英偉達的兩個野心,一個是 DPU 試圖再一次復(fù)制 "GPU 替代顯示加速卡成為通用顯示芯片的路徑 ",在一個是 DOCA 試圖再一次復(fù)制 "CUDA 在 GPU 通用化過程中所起到的開創(chuàng)生態(tài)之功 "。
如果和不久前英偉達收購 ARM 的消息結(jié)合起來,我們看到英偉達的一個重要考量,就是以 ARM 架構(gòu)的 CPU 為核心,從服務(wù)器的應(yīng)用加速擴展到服務(wù)器的全部應(yīng)用場景,從而實現(xiàn)在數(shù)據(jù)中心服務(wù)器領(lǐng)域的更大突破,目標(biāo)自然是劍指英特爾 CPU 為代表的 X86 服務(wù)器生態(tài)。
而在考察 DPU 挑戰(zhàn) CPU 霸主地位的可能性之前,我們可以簡單來了解下英偉達在數(shù)據(jù)中心的布局。
英偉達的數(shù)據(jù)中心 " 野心 "
在經(jīng)歷過游戲顯卡業(yè)務(wù)的增速放緩,以及加密貨幣退潮后帶來的顯著業(yè)績下滑的影響之后,幾經(jīng)波折的英偉達終于堅定地將未來押注在了 AI 計算和數(shù)據(jù)中心的產(chǎn)業(yè)布局上面。
2017 年,英偉達的數(shù)據(jù)中心業(yè)務(wù)季度營收首次超過了 5 億美元,同比增長了 109%,這使得黃仁勛在一次大會上大力肯定了數(shù)據(jù)中心業(yè)務(wù)的價值。
英偉達早在 2008 年,最初就是通過最早的 Tesla GPU 加速器和初級的 CUDA 編程環(huán)境來為數(shù)據(jù)中心進行 GPU 計算,試圖將更多的并行計算從 CPU 卸載到 GPU 上。這成為英偉達 GPU 之后進化之路的一條長期策略。
此后隨著 AI 計算需求在數(shù)據(jù)中心當(dāng)中的爆發(fā)式增長,AI 硬件正成為越來越多數(shù)據(jù)中心擴容建設(shè)的關(guān)鍵所在。當(dāng)超強 AI 算力成為數(shù)據(jù)中心的剛需,英偉達 GPU 憑借強大的并行計算和浮點能力,突破了深度學(xué)習(xí)的算力瓶頸,成為 AI 硬件的首選。這一契機才使得英偉達能夠在數(shù)據(jù)中心的硬件版圖上站穩(wěn)腳跟,當(dāng)然,英偉達的野心遠不止于此。
英偉達最主要的布局就在于 2019 年 3 月,花費 69 億美元收購了以色列芯片公司 Mellanox,而這家公司所擅長的正是為服務(wù)器、存儲和超融合基礎(chǔ)設(shè)施提供包括以太網(wǎng)交換機、芯片和 InfiniBand 智能互連解決方案在內(nèi)的大量的數(shù)據(jù)中心產(chǎn)品。而英偉達的 GPU 與 Mellanox 的互連技術(shù)結(jié)合,可以使得數(shù)據(jù)中心工作負(fù)載將在整個計算、網(wǎng)絡(luò)和存儲堆棧中得以優(yōu)化,并能實現(xiàn)更高的性能、更高的利用率和更低的運營成本。
當(dāng)時,黃仁勛把 Mellanox 的技術(shù)看作是公司的 "X 因素 ",也就是把數(shù)據(jù)中心改造成一個可以解決高性能計算要求的大型處理器架構(gòu)。而如今我們看到 DPU 的出現(xiàn),已經(jīng)是具有這一架構(gòu)雛形的一種嘗試了。
今年,英偉達花費 400 億美金的天價從軟銀手中收購半導(dǎo)體設(shè)計公司 ARM,其意圖之一就是要把 ARM 架構(gòu)的 CPU 設(shè)計應(yīng)用到英偉達所要搭建的未來計算模式中,主要布局的領(lǐng)域就有超算、自動駕駛和邊緣計算模式。其中,基于英偉達 GPU 的 AI 運算平臺與 ARM 的生態(tài)系統(tǒng)結(jié)合,將不僅能夠強化英偉達高性能運算 ( HPC ) 技術(shù)能力,又可以帶動英偉達數(shù)據(jù)中心業(yè)務(wù)營收持續(xù)創(chuàng)高。
可以說,英偉達在數(shù)據(jù)中心領(lǐng)域的成功與否,都與能否實現(xiàn)數(shù)據(jù)中心的規(guī)模化運算有關(guān),從發(fā)展自研的 DGX 系列服務(wù)器到整合 Mellanox 的技術(shù),再到借助 ARM 生態(tài)發(fā)展全新的數(shù)據(jù)中心計算架構(gòu),都是為轉(zhuǎn)型數(shù)據(jù)中心業(yè)務(wù)所作的準(zhǔn)備。
當(dāng)然,想要實現(xiàn)這一目標(biāo),還要看下英特爾是否答應(yīng)了。
英偉達挑戰(zhàn)英特爾,距離還有多遠
目前來說,數(shù)據(jù)中心當(dāng)中,95%左右的 GPU 仍然還是連接到 x86 的 CPU 之上,英偉達如果單純只是做 GPU 的增量,仍然無法撼動英特爾在數(shù)據(jù)中心服務(wù)器的霸主地位。現(xiàn)在,英偉達顯然已經(jīng)不滿足于抓住增量市場,而是更希望能切入數(shù)據(jù)中心的存量市場,即設(shè)法用自己的芯片產(chǎn)品去取代英特爾(以及 AMD)主導(dǎo)的 X86 CPU。
自從英偉達開始收購 ARM,外界能夠看到英偉達已經(jīng)多次顯示出其試圖利用 ARM 處理器進一步占領(lǐng)數(shù)據(jù)中心服務(wù)器市場的決心,而集成了 ARM 核心的 DPU 將成為其打入數(shù)據(jù)中心存量市場取代 X86 CPU 的第一個切入點。
英偉達推出 DPU 來切入這個市場,而非直接用 ARM 核心 CPU 來與 X86 CPU 直接競爭,其實是一種比較討巧的做法,相當(dāng)于用集成了網(wǎng)絡(luò)、存儲、安全等任務(wù)的下一代 CPU 產(chǎn)品來達到逐漸替換 CPU 的目的,即使其中所內(nèi)涵的 ARM CPU 性能無法對標(biāo)同一代的 X86 CPU,但是整體機由于在 DPU SoC 上集成了專用的處理加速模塊,因此總體性能一定是超過 X86 CPU 的。這種有點 " 田忌賽馬 " 味道的策略,很可能成為英偉達開始替代低端 X86 CPU 的開始。
但是英偉達想要在中高端處理器市場來挑戰(zhàn)英特爾,還要面臨一系列的困難。
首先,正是英偉達的 GPU 與 X86 CPU 已經(jīng)形成一種非常穩(wěn)定的強互補關(guān)系。英偉達想要采用基于 ARM 架構(gòu)的處理器做高端服務(wù)器,還需要 ARM 處理器性能出現(xiàn)大幅的提升,而現(xiàn)在,這一進程并不明朗。
再一個是英特爾早已為應(yīng)對英偉達的種種挑戰(zhàn)進行了相應(yīng)的回應(yīng)和布局。早在 2017 年,英特爾就宣布要開發(fā)全棧的 GPU 產(chǎn)品組合,而預(yù)計明年英特爾的首批 GPU 將在使用 GPU 的各個市場上發(fā)布。
為阻擊英偉達在 AI 計算和自動駕駛領(lǐng)域的擴張,英特爾也先后收購了收購了 Nervana 和 Movidius 作為邊緣 AI 計算的布局,收購了 Mobileye 作為自動駕駛的布局。并且,英特爾還在 2018 年宣布,將開發(fā)一個用于異構(gòu)計算的全棧開放軟件生態(tài)系統(tǒng) OpenAPI 計劃,來應(yīng)對 CUDA 生態(tài)的擴張。也就是說,英特爾不僅在英偉達的后院搞事情,同時也在建立自身的 X86 服務(wù)器的生態(tài)系統(tǒng)。
數(shù)據(jù)中心業(yè)務(wù)對于英特爾來說,也正在成為其最核心的業(yè)務(wù)組成。2019 年 Q4 英特爾的數(shù)據(jù)中心業(yè)務(wù)超越 PC 業(yè)務(wù),成為其收入的主要來源;而在今年,英特爾對其技術(shù)組織和執(zhí)行團隊的重組,也被外界視為全面轉(zhuǎn)型數(shù)據(jù)中心業(yè)務(wù)的開始。
可以想見在未來的數(shù)據(jù)中心處理器業(yè)務(wù)上,英偉達將迎來英特爾最為強勁的保衛(wèi)戰(zhàn)和反擊戰(zhàn),而廣大的服務(wù)器集成商或?qū)⒊蔀檫@場角力賽的受益方。
螳螂捕蟬黃雀在后,英偉達還要面對 ADM 這一新對手的追趕。不久前 ADM 曝出要花費 300 億美金收購賽靈思,就被砍作是叫板英特爾,阻擊英偉達的雙戰(zhàn)略。
除此之外,英偉達還要在數(shù)據(jù)中心處理器業(yè)務(wù)中面臨來自客戶自研芯片的挑戰(zhàn)。云服務(wù)商本身也不愿意完全將自身的計算核心完全交給英偉達,無論是 AWS、還是谷歌、阿里巴巴、華為,都已經(jīng)在布局自己的云端處理器。
不管怎么說,數(shù)據(jù)中心已經(jīng)成為英特爾、英偉達、AMD 這些老牌芯片巨頭未來爭奪的主戰(zhàn)場,而英偉達如何能夠在 X86 的如日中天和云計算客戶的自研路線中,找到一個切入到中高端服務(wù)器處理器的關(guān)鍵點,剛剛發(fā)布的 DPU 也只能算作一個初步的嘗試。
未來數(shù)據(jù)中心的博弈,將圍繞 AI、超算等所有領(lǐng)域全面展開,英偉達在前有強敵,后有追兵,盟友擁兵自立的境遇下,其數(shù)據(jù)中心的征程仍然任重而道遠。