“東數西算”帶來的產業新機遇
2020年12月23日,國家發展改革委、中央網信辦、工業和信息化部、國家能源局聯合印發《關于加快構建全國一體化大數據中心協同創新體系的指導意見》,提出構建全國一體化大數據中心協同創新體系,“東數西算”工程首現于公眾視野。
2021年5月24日,《全國一體化大數據中心協同創新體系算力樞紐實施方案》聯合印發,提出布局建設全國一體化算力網絡國家樞紐節點,加快實施“東數西算”工程,國家樞紐節點之間進一步打通網絡傳輸通道,加強云算力服務、數據流通、數據應用、安全保障等方面的探索實踐。2022年1月,京津冀、長三角、粵港澳大灣區、成渝、貴州、甘肅、內蒙古和寧夏八大國家算力樞紐建設節點相繼獲批。至此,繼“西氣東輸”“西電東送”“南水北調”之后,國家又一重大工程“東數西算”工程全面啟動,正式開啟我國算力資源跨區域統籌布局的新篇章。
對此,業界普遍認為,實施“東數西算”工程,優化算力資源空間布局,既利于緩解數據中心行業高耗能問題、降低東部企業運營成本、提振西部數字經濟和保障國家數據安全穩定,又利于推動新型基礎設施高質量發展,對相關產業上下游的持續拉動作用凸顯。
有專家強調,“東數西算”應重在強化東西部算力樞紐集群內部和集群之間的統籌聯動,推動節點之間算力網絡的協同布局。 據了解,隨著“東數西算”工程啟動,目前不少地方行業主管部門一方面加快算力體系智能化升級,包括推動智能分析和應用計算在行業的應用和落地;另一方面也在探索和建立行業公共算力基礎設施。在更多企業不具備資金和技術實力建設具有大規模算力中心的情況下,為其提供便利。公共算力基礎設施建成后,將以行業云的方式提供算力資源,推動行業內大型單位向中小單位輸出更加先進、更加靈活的計算能力。
同時,這些行業主管部門也在積極研究安全可信的算力產品,目的是提高自主研發算力在行業中的應用,包括提升供應鏈安全水平,解耦云計算算力服務和硬件基礎設施之間的綁定關系。此外,隨著云計算技術的快速迭代發展,以算力為主導的行業數字化發展正在成為主流,很多行業企業也熱衷于嘗試一些新興的基礎架構。
“新一輪科技革命和產業變革,讓數字經濟站上主流賽道。萬物皆可以數字,萬物皆可以連接,萬物皆可以應用。這種數據信息的生態體系建設,將會無處不在。” 青云科技副總裁、數字價值研究院院長沈鷗表示。 沈鷗認為,“東數西算”將不單單是數據中心的工程建設,也不單單是算力的堆砌,必然會涉及技術升級、產業升級。從青云的角度來看,包括綠色節能數據中心、算力調度、海量數據存儲和流通、數據智能分析、數據安全都將隨著“東數西算”的建設得到更多的研發投入和產業升級,而且需要產業鏈上下游協同創新。
專注鑄就底氣,實力支撐國家工程
從最初的一家云計算軟件與服務公司成長為企業級云服務和數字化解決方案供應商,青云科技在國內競爭激烈的云計算市場打拼整整十年。十年來,其在云計算技術領域自主研發和產品開發的磨礪,不僅幫助企業用戶在數字化轉型上走得更快更穩,也使青云自身發展同樣“快準穩”,并在云計算、混合云上有了深厚的技術積累和行業經驗。一貫秉持的自主創新和開放中立策略使其服務在多個行業領域遍地開花。
在云原生領域,青云主導的國內頗具影響力的開源產品KubeSphere容器平臺及云原生社區,助推云原生技術在行業領域快速發展。2020年“新基建”正式升級為國家戰略,青云結合物聯網、邊緣計算、軟件快速開發迭代等方面的技術探索實踐,以及在工業制造、智慧醫療、金融科技等領域的數字化經驗,加速了企業流程數字化和過程智能化改造,幫助企業構筑數字化能力新基石,進一步鑄就了青云科技全力參與“東數西算”國家級工程的底氣。
“在整個算力中心建設上,‘東數西算’工程一方面會新建一批綠色低PUE(電源使用效率)數據中心,也會整合原有高能耗的數據中心,減少數據中心在國家能源消耗中的占比;另一方面,是提供算力服務來滿足政府和行業企業的數字化計算、數據分析需求。這兩方面在‘東數西算’整體綱要中都有所提及。”沈鷗表示。
對此,青云科技認為,算力中心建設應由以下四個要素組成。
首先是機房設施建設。新的數據中心將主要集中在資源較為充沛的中西部地區,充分利用中西部充足的清潔能源、低成本電價以及地理氣候,結合模塊化的數據中心設施、一體化的電力模塊、智能鋰電等先進的節能技術,來建設高等級、低能耗的數據中心。
其次是數據中心基礎架構管理及能耗管理。數據中心建設完成后,以物聯網、邊緣計算為技術核心的新型數據中心基礎架構管理及能耗管理,將為數據中心的整個管理帶來統一的數據采集、集成和分析,從而更有效地對數據中心的運行進行綜合管控。比如,以更精準的方式進行能耗監控,基于該策略進行算力調度,服務其能耗優化,最大程度節省數據中心的能源消耗,提升其自動化能力。
第三是多元算力操作系統。算力中心的重點和關鍵還在于多元算力操作系統。該系統架構在數據中心之上,提供計算、存儲、網絡、安全的資源管理和調度,交付多元算力,來支持和支撐數據的計算和分析、應用的運行和業務處理。從而賦予數據中心真正的動力。
最后是多算力集群的運營運維服務。在算力中心建設四要素中,青云將更關注數據中心智能化管理和能耗管理、多元算力操作系統以及多集群運營運維服務平臺。
關于智能化管理及能耗管理,作為數據中心建設重點,青云有著自己的理解。“新建數據中心PUE現在被要求限制在1.3以下,改造的存量數據中心PUE通常要求在1.4附近,這是有一定挑戰的。”沈鷗表示,“對于大型數據中心而言,如果系統IT負載率取值,比如0.9或1的差別,就可以使服務器總體能耗相差10%。所以能耗管控與調度,都能對數據中心的整體能耗產生很大變化和影響。青云結合物聯網、邊緣計算等技術,與數據中心基礎架構管理廠商(即DCM廠商)合作,打造智算數據中心管理平臺,構建整個數據中心統一的運維數據中臺,包括統一的設備數據采集平臺、統一的設備配置數據庫、統一的監控告警平臺、統一的運維管理流程、統一的管理調度服務,相當于為整個數據中心提供一個技術和業務的數據中臺。”
事實上,早在2020年“新基建”正式發布之初,青云就看到了數字化對算力中心和多元算力的需求,因此及早開始對算力相關技術深入布局,并加大投入相應的研發力量做產品迭代和解決方案的完善。時至今日,青云已具備支撐算力中心建設三大核心要素的能力,具體為通過智能算力平臺、高性能計算平臺、AI計算平臺、海量存儲平臺、智能數據中心管理平臺,提供全面的技術支撐能力。
全力打造算力時代發展新引擎
“青云在整個‘東數西算’領域一直在構筑的核心能力就是打造多元算力的超級智算平臺,該平臺向下可以接駁多樣性算力,向上能夠支撐行業應用。而多元算力操作系統則是通過對多樣性算力的管理和調度來支撐行業應用的計算和行業數據的智能分析。”沈鷗說。
提及多元算力操作系統,沈鷗介紹說,青云主要提供四方面的平臺能力:一是算力生產供應平臺。包括多樣性算力、標準云平臺算力服務、高性能計算能力、物聯網和邊緣計算能力,以及GPU、AI為主的AI算力能力。二是數據開放共享平臺。主要依托青云多年在數據庫、大數據、PaaS平臺經驗,利用大數據工作臺產品來支撐企業數據在生產、采集、計算上的服務要求。三是智能生態建設平臺。主要提供開放的應用框架,無論是傳統應用,還是當前熱點的云原生應用、AI應用或是各種行業專屬應用,都可以通過應用中心框架進行云化,成為可以被訪問的PaaS服務或SaaS服務,從而創建豐富的計算服務生態和行業應用生態。這對一些行業算力中心和算力平臺而言其價值不言而喻。四是產業創新開發平臺。主要聚焦行業應用開發和迭代,引入低代碼開發平臺、DevOps流程開發平臺,以及API聚合、Serverless等技術能力,從而為業務流程的重建和業務場景的迭代提供有力支撐。
在整體能力搭建上,青云將通過技術開源,支持開放標準,從而將相關技術能力更為廣泛地應用到多行業領域,相關應用服務涵蓋智能制造、醫藥分析、地理海洋預測等。至于青云超級智算平臺底層的算力服務,包括網絡互聯能力、海量存儲能力,則都為青云自主研發產品,并完全采用分布式架構,滿足海量擴展需求。
如何將算力轉化為便捷易用的基礎設施,讓算力成為真正的基礎設施,各種應用、算法或模型都能更便捷地運用到算力,也是青云一直在思考和努力的方向。“算力不是孤立存在的,算力的價值是以更快、更短的時間完成數據分析、業務計算任務,推動業務進程和管理活動。”沈鷗坦言,“青云秉承多年云服務經驗,深刻理解業務實現在云服務中的價值。所以分別在2014年、2017年發布了云平臺應用中心(AppCenter)1.0、2.0,提出了基于統一框架加速應用上云,提升云服務能力。2020年發布了超算應用中心,支持EDA、CFD等行業應用在青云超級智算平臺上的發布和部署。這是近兩年企業數字化轉型,特別是工業領域企業的現實需求,我們能讓行業能力和算力進行有效連接,這也是青云超級智算平臺支撐眾多行業場景的技術基礎。”
據介紹,青云科技通過新型采集網關和分布式物聯平臺,實現了對數據中心樓宇自控、數據中心設備運行數據的毫秒級采樣。借助青云的服務,數據中心可以實現每秒采集1萬個采樣點數據,存儲12萬條采樣數據,每天可以分析和處理100G以上的各類運行指標數據。如此一來將更加精準計算各類設備能耗,對高能耗設備進行調度和控制,從而更加有效地減少數據中心的PUE,通過管理提升效能。
目前,青云超級智算中心平臺已在國家級超算中心落地。青云科技負責承建超算公共服務云、政務行政服務云和公共云,提供HPC高性能計算、EHPC彈性高性能計算、標準云服務(IaaS/PaaS/GPU/AI),并基于分布式云以及基于分布式云架構的區域云服務,為整個超算業務提供統一的應用服務能力,將多種模式合而為一,通過一個統一平臺交付給客戶。使用者能通過統一的算力平臺門戶,更便捷地實現算力服務的訪問和應用調度的發布。隨著更多應用的上線,客戶最終能夠一鍵實現其相應業務的分析。 超級智算平臺的成功部署,其實還凝聚了青云多項核心技術能力。
首先,超級智算平臺是在一個平臺上提供多樣性算力,每種算力都支持海量擴展、按需擴容、按需增加節點。其次,基于分布式的云架構和軟件定義廣域網技術,超級智算平臺能夠跨地域分布式部署,在統一的運營框架下,算力服務可以跨域申請和使用,服務和應用的訪問也可以跨域,而且在統一用戶管理、統一運營體系下。
最重要的是,整個超級智算平臺的核心代碼都由青云科技自主研發,并堅持迭代開發。 隨著“東數西算”工程進一步深化,必然會延展出更多技術和應用的場景,比如在智能分析和算力調度上的有機結合。沈鷗進一步表示,圍繞省級云網融合、多網融合的算力網絡,青云科技將繼續投入研發,與業界相關企業一起合作,從而提供更具技術能力的產品來支持國家數字經濟高質量發展。