數智時代的最大特點,就是AI人工智能的廣泛應用。
進入21世紀以來,移動通信、光通信、云計算、大數據等ICT技術蓬勃發展,推動了企業的數字化轉型。數據,變成了企業最核心的資產。
企業將這些數據資產全部存儲并運行在數據中心之上。隨著數字化的不斷深入,數據規模變得越來越龐大。
2025年新增的數據量將達到180ZB(數據來源:華為GIV)
傳統的軟件算法,根本無法處理如此海量的數據(更何況,其中95%以上都是語音、視頻等非機構化數據)。于是,我們找來了能力更強的幫手,那就是——AI(人工智能)。
AI可以完成海量無效數據的篩選和有用信息的自動重組,從而大幅提升數據價值的挖掘效率,幫助用戶更高效地進行決策。
然而,想要利用好這個神器,我們需要三大要素的支持,那就是算法、算力和數據。
AI算法強不強,訓練是關鍵。深度學習的算法訓練,離不開海量的樣本數據,以及高性能的計算能力。
在存儲能力方面,從HDD(機械硬盤)到SSD(高速閃存盤),再到SCM(存儲級內存),介質時延降低了100倍以上,可以滿足高性能數據實時存取需求。
在計算能力方面,從CPU到GPU,再到專用的AI芯片,處理數據的能力也提升了100倍以上。
那么,這是否意味著數據中心能夠完全滿足AI規模應用的要求呢?
別急著說是,我們不能忘了一個重要的性能制約因素,那就是——網絡通信能力。
事實上,網絡通信能力確實拖了存儲能力和計算能力的后腿。數據顯示,在存儲介質和計算處理器演進之后,網絡通信時延已經成為了數據中心性能提升的瓶頸。通信時延在整個存儲E2E(端到端)時延中占比,已經從10%躍遷到60%以上。
也就是說,寶貴的存儲介質有一半以上的時間是在等待通信空閑;而昂貴的處理器,也有一半時間在等待通信同步。
網絡通信能力,已經在數據中心形成了木桶效應,變成了木桶的短板。
█ 數據中心通信網絡,到底出了什么問題?
上世紀70年代,TCP/IP和以太網技術相繼誕生。
它們成本低廉、結構簡單,為互聯網的早期發展做出了巨大貢獻。
但是,隨著網絡規模的急劇膨脹,傳統TCP/IP和以太網技術已經跟不上時代的步伐,它們落后的架構設計,反而制約了互聯網的進一步發展。
2010年后,數據中心的業務類型逐漸聚焦為三種,分別是高性能計算業務(HPC),存儲業務和一般業務。
這三種業務,對于網絡有不同的訴求。比如HPC業務的多節點進程間通信,對于時延要求非常高;而存儲業務,對通信可靠性的要求非常高,網絡需要實現絕對的0丟包;一般業務的規模巨大,擴展性強,要求網絡低成本易擴展。
傳統以太網可以適用于一般業務,但是無法應對高性能計算和存儲業務。于是,業界發展出了Infiniband(直譯為“無限帶寬”技術,縮寫為IB)網絡,應對有低時延要求的網絡IPC通信;發展出了FC(Fibre Channel,光纖通道)網絡,提供高可靠0丟包的存儲網絡。
IB專網和FC專網的性能很強,但是價格昂貴,是以太網的數倍。而且,兩種專網需要專人運維,會帶來更高的維護成本。
是不是有辦法,將三種網絡的優勢進行結合呢?有沒有一種網絡,可以同時實現高吞吐、低時延和0丟包?
這里,我先賣個關子,不揭曉答案。我們回過頭來,看看TCP/IP協議棧的痛點。
傳統的TCP/IP協議棧,實在是太老了。它的很多致命問題,都是與生俱來的。比如說它的時延,還有它對CPU的占用。
為了解決問題,專家們提出了一種新型的通信機制——RDMA(Remote Direct Memory Access,遠程直接數據存取),用于取代TCP/IP。
RDMA相當于是一個快速通道技術,在數據傳輸時延和CPU占用率方面遠遠強于TCP/IP,逐漸成為主流的網絡通信協議棧。
RDMA有兩類網絡承載方案,分別是專用InfiniBand和傳統以太網絡。
InfiniBand是一種封閉架構,交換機是特定廠家提供的專用產品,采用私有協議,無法兼容現網,加上對運維的要求過于復雜,并不是用戶的合適選擇。
除了InfiniBand之外,那就只剩下傳統以太網了。
那比較尷尬的是,RDMA對丟包率的要求極高。0.1%的丟包率,將導致RDMA吞吐率急劇下降。2%的丟包率,將使得RDMA的吞吐率下降為0。
而傳統以太網,工作機制是“盡力而為”,丟包是家常便飯。
又回到了前面那個問題:我們究竟有沒有0丟包、高吞吐的新型開放以太網,用于支撐低延時RDMA的高效運行呢?
Duang!答案揭曉——
辦法當然是有的,那就是來自華為的超融合數據中心網絡智能無損技術。
█ 華為的零丟包秘技
華為的智能無損技術到底有何神通,可以解決困擾傳統以太網已久的丟包問題?
其實,想要實現零丟包,首先要搞清楚網絡為什么會產生丟包。
網絡丟包的基本原因其實很簡單,就是發生了溢出——網絡流量超過了數據中心交換機的處理和緩存能力。
應對溢出,業界通用的做法,就是控制發送端的發送速度,從而避免超過交換機處理能力的擁塞形成。
具體來說,就是在交換機端口設置報文緩存隊列,一旦隊列長度超過某一個閾值(擁塞水線),對擁塞報文進行擁塞標記,流目的端向源端發送降速信號,即顯式擁塞通知ECN(Explicit Congestion Notification)。
源端收到通知,從而降低發送速度,規避擁塞。
我們可以看出,這個閾值的設置非常關鍵。它決定了對報文進行擁塞標記的時機,是網絡中是否會發生擁塞的決定性因素。
閾值的設置,是一門非常深的學問。
如果設置太保守,就會降速太多,影響系統吞吐能力。如果設置太激進,則無法達到無損的效果。
更關鍵的是,網絡的業務類型是多樣且變化的,有時候需要高吞吐,有時候又需要低時延。即便是有經驗的專家,好不容易花了幾天的時間,設置好了最佳水線位置,結果它又變了,咋整?
于是,華為想到了最適合干這個活的角色,那就是——AI。
早在2012年,華為為了應對未來數據洪水挑戰,投入了數十個科學家,啟動新一代無損網絡的研究。
經過多年的潛心鉆研和探索,他們搞出了獨具創新的iLossless智能無損算法方案。這是一個通過人工智能實現網絡擁塞調度和網絡自優化的AI算法。
華為iLossless智能無損算法以Automatic ECN為核心,并首次在超高速數據中心交換機引入深度強化學習DRL(Deep Reinforcement Learning)。
對比傳統靜態閾值配置僵化,無法動態適應網絡變化的缺點,Automatic ECN為以太網的流量調度提供了智能預測能力,可以根據當前流量狀態精準預測下一刻的擁塞狀態,提前做好預留和準備。
基于iLossless智能無損算法,華為發布了超融合數據中心網絡CloudFabric 3.0解決方案,引領智能無損進入1.0時代。
2022年,華為超融合數據中心網絡繼續探索,提出了更強大的智能無損網算一體技術和創新直連拓撲架構,可實現270k大規模算力樞紐網絡(組網規模4倍于業界,可助力構建E級和10E級大型和超大型算力樞紐),時延在智能無損1.0的基礎上,可進一步降低25%。
華為的智能無損2.0,基于在網計算(In.NETwork computing)和拓撲感知(Topology-Aware Computing)實現網絡和計算協同。一方面,網絡參與計算信息的匯聚和同步,減少計算信息同步的次數;另一方面,通過調度確保計算節點就近完成計算任務,減少通信跳數,進一步降低應用時延。
以MPI_allreduce為例,相比傳統網絡僅做數據轉發不參與計算過程,華為超融合數據中心網絡可有效降低時延,提升計算效率27%。
華為超融合數據中心網絡解決方案,為數據中心構建了統一融合網絡,取代了此前的三種不同類型網絡(LAN、SAN、IPC),大幅減少了網絡建設成本和運維成本,總成本TCO下降了53%。AI業務的運行效率,則提升了30%以上。
█ 智能無損技術的積累沉淀
近年來,華為圍繞智能無損網絡和iLossless智能無損算法,接連發布了多個產品和解決方案。
2018年10月,華為就發布了AI Fabric極速以太網解決方案,幫助客戶構建與傳統以太網兼容的RDMA網絡,引領數據中心網絡進入極速無損的高性能時代。
2019年1月,華為又發布了業界首款面向AI時代的數據中心交換機CloudEngine 16800,承載了iLossLess智能無損交換算法,實現流量模型自適應自優化,從而在零丟包的基礎上,獲得更低時延和更高吞吐的網絡性能。
2021年6月,華為發布全無損以太存儲網絡解決方案(NoF+)。該方案基于OceanStor Dorado全閃存存儲系統和CloudEngine數據中心存儲網絡交換機構建,可實現存儲場景端到端數據加速,充分釋放全閃存性能潛力。
除了自身積極進行技術研究和產品化之外,華為還積極推動相關技術標準的成熟。
2021年8月,華為發布的智能無損技術論文《ACC: Automatic ECN Tuning for High-Speed Datacenter Networks》(高性能數據中心網絡中的ECN動態調優)入選全球網絡通信頂級會議ACM SIGCOMM 2021,得到業界專家的一致認可,具有世界級技術影響力。
在華為主導下,IEEE 802成立了Nendica(“Network Enhancements for the Next Decade” Industry Connections Activity)工作組,聯合業界共同探討以太網技術標準發展的新方向,為智能無損網絡技術發展提供了理論研究的開放土壤。
█ 智能無損技術的落地實踐
經過實際項目驗證并獲得客戶認可的技術,才是可靠的技術。
華為的超融合數據中心網絡CloudFabric 3.0解決方案,已經在金融、政府、超算中心、智算中心等客戶廣泛應用。包括中國銀行、云南農信、華夏銀行、湖北移動、中科院高能物理研究所、武漢人工智能計算中心、鵬城實驗室等在內的眾多高端用戶,都是華為智能無損技術的使用者。
中國銀行聯合華為打造的新一代智能無損存儲網絡“RoCE-SAN”,結合中行具體的應用場景,實現了智能緩存管理、逐流精準控速、故障高可用秒級切換的技術創新突破,滿足金融級高可用存儲網絡要求。
中科院高能物理研究所通過與華為的聯合創新,采用零丟包以太網技術,構建了由數萬顆CPU核構成的跨地域的高性能計算環境,很好地滿足了高能物理領域對算力的需求。
某互聯網巨頭布局無人駕駛,無人駕駛技能的訓練涉及到大量的AI計算:1天采集的數據,需要幾百的GPU服務器7天才能訓練完,嚴重影響無人駕駛的上市時間。通過華為的智能無損技術,最終使得整體訓練的時長縮短40%,加速無人駕駛的商用進程。
除了豐富的行業落地案例,華為智能無損技術還獲得了大量的行業獎項:
2018年6月,日本Interop展Best of Show Award金獎
2020年12月,中國銀行業金融科技應用成果大賽“最佳解決方案獎”
2021年4月,日本Interop展Best of Show Award 2020銀獎
2021年5月,2021數博會領先科技成果獎之“黑科技”類別
2021年10月,高性能計算領域 “融合架構創新獎”
2022年3月,中國通信學會科學技術獎特等獎
……
這些來自專業領域的認可,更加證明了華為基于智能無損技術的超融合數據中心網絡解決方案,在領導力和先進性方面居于行業領先地位。
█ 結語
從邏輯上來看,華為基于智能無損技術的超融合數據中心網絡解決方案,是將AI技術在數據中心進行落地,用AI賦能數據中心,再用數據中心,去支撐AI應用。這是一種非常有趣的良性循環,引領了整個ICT行業的智能化潮流。
這個方案是為算力時代量身定制的,可以很好地滿足算力時代計算、存儲、業務等多種場景數據流通的需要。
放眼未來,AI與數據中心的深度融合,將完美支撐企業數字化轉型所需的算力需求,加速數據存儲和處理過程,幫助企業快速決策,加快邁入數智時代。