從最初的一家云計算軟件與服務公司成長為企業級云服務和數字化解決方案供應商,青云科技在國內競爭激烈的云計算市場打拼整整十余年。十余年來,青云科技在云計算技術領域自主研發和產品開發的磨礪,不僅幫助企業客戶在數字化轉型上走得更快更穩,也使自身發展同樣“快準穩”,并在算力時代有了深厚的技術積累和行業經驗。
“在整個算力中心建設上,‘東數西算’工程一方面會新建一批綠色低PUE(電源使用效率)數據中心,也會整合原有高能耗的數據中心,減少數據中心在國家能源消耗中的占比;另一方面,是提供算力服務來滿足政府和行業企業的數字化計算、數據分析需求。這兩方面在‘東數西算’整體綱要中都有所提及。”青云科技副總裁、數字價值研究院院長沈鷗表示。
對此,青云科技認為,算力中心建設應由以下四個要素組成。
首先是機房設施建設。新的數據中心將主要集中在資源較為充沛的中西部地區,充分利用中西部充足的清潔能源、低成本電價以及地理氣候,結合模塊化的數據中心設施、一體化的電力模塊、智能鋰電等先進的節能技術,來建設高等級、低能耗的數據中心。
其次是數據中心基礎架構管理及能耗管理。數據中心建設完成后,以物聯網、邊緣計算為技術核心的新型數據中心基礎架構管理及能耗管理,將為數據中心的整個管理帶來統一的數據采集、集成和分析,從而更有效地對數據中心的運行進行綜合管控。比如,以更精準的方式進行能耗監控,基于該策略進行算力調度,服務其能耗優化,最大程度節省數據中心的能源消耗,提升其自動化能力。
第三是多元算力操作系統。算力中心的重點和關鍵還在于多元算力操作系統。該系統架構在數據中心之上,提供計算、存儲、網絡、安全的資源管理和調度,交付多元算力,來支持和支撐數據的計算和分析、應用的運行和業務處理。從而賦予數據中心真正的動力。
最后是多算力集群的運營運維服務。
在算力中心建設四要素中,青云科技將更關注數據中心智能化管理和能耗管理、多元算力操作系統以及多集群運營運維服務平臺。 關于智能化管理及能耗管理,作為數據中心建設重點,青云科技有著自己的理解。“新建數據中心PUE現在被要求限制在1.3以下,改造的存量數據中心PUE通常要求在1.4附近,這是有一定挑戰的。”沈鷗表示,“對于大型數據中心而言,如果系統IT負載率取值,比如0.9或1的差別,就可以使服務器總體能耗相差10%。所以能耗管控與調度,都能對數據中心的整體能耗產生很大變化和影響。青云結合物聯網、邊緣計算等技術,與數據中心基礎架構管理廠商(即DCM廠商)合作,打造智算數據中心管理平臺,構建整個數據中心統一的運維數據中臺,包括統一的設備數據采集平臺、統一的設備配置數據庫、統一的監控告警平臺、統一的運維管理流程、統一的管理調度服務,相當于為整個數據中心提供一個技術和業務的數據中臺。”
事實上,早在2020年“新基建”正式發布之初,青云科技就看到了數字化對算力中心和多元算力的需求,因此及早開始對算力相關技術深入布局,并加大投入相應的研發力量做產品迭代和解決方案的完善。時至今日,青云已具備支撐算力中心建設三大核心要素的能力,具體為通過智能算力平臺、高性能計算平臺、AI計算平臺、海量存儲平臺、智能數據中心管理平臺,提供全面的技術支撐能力。
“青云在整個‘東數西算’領域一直在構筑的核心能力就是打造多元算力的超級智算平臺,該平臺向下可以接駁多樣性算力,向上能夠支撐行業應用。而多元算力操作系統則是通過對多樣性算力的管理和調度來支撐行業應用的計算和行業數據的智能分析。”沈鷗說。
提及多元算力操作系統,沈鷗介紹說,青云主要提供四方面的平臺能力:一是算力生產供應平臺。包括多樣性算力、標準云平臺算力服務、高性能計算能力、物聯網和邊緣計算能力,以及GPU、AI為主的AI算力能力。二是數據開放共享平臺。主要依托青云多年在數據庫、大數據、PaaS平臺經驗,利用大數據工作臺產品來支撐企業數據在生產、采集、計算上的服務要求。三是智能生態建設平臺。主要提供開放的應用框架,無論是傳統應用,還是當前熱點的云原生應用、AI應用或是各種行業專屬應用,都可以通過應用中心框架進行云化,成為可以被訪問的PaaS服務或SaaS服務,從而創建豐富的計算服務生態和行業應用生態。這對一些行業算力中心和算力平臺而言其價值不言而喻。四是產業創新開發平臺。主要聚焦行業應用開發和迭代,引入低代碼開發平臺、DevOps流程開發平臺,以及API聚合、Serverless等技術能力,從而為業務流程的重建和業務場景的迭代提供有力支撐。
目前,青云超級智算中心平臺已在國家級超算中心落地。青云科技負責承建超算公共服務云、政務行政服務云和公共云,提供HPC高性能計算、EHPC彈性高性能計算、標準云服務(IaaS/PaaS/GPU/AI),并基于分布式云以及基于分布式云架構的區域云服務,為整個超算業務提供統一的應用服務能力,將多種模式合而為一,通過一個統一平臺交付給客戶。使用者能通過統一的算力平臺門戶,更便捷地實現算力服務的訪問和應用調度的發布。隨著更多應用的上線,客戶最終能夠一鍵實現其相應業務的分析。