導(dǎo)讀:“東數(shù)西算”全面啟動,全國各地大力推進算力基礎(chǔ)設(shè)施建設(shè),“建好、管好、用好”面臨重大挑戰(zhàn),青云科技打造新一代超級智算平臺,實現(xiàn)算力中心健康發(fā)展。
需求與政策雙重驅(qū)動 中國算力健康發(fā)展
當(dāng)前,新一輪科技革命和產(chǎn)業(yè)變革正在重塑全球經(jīng)濟結(jié)構(gòu)。算力作為數(shù)字經(jīng)濟的核心生產(chǎn)力,成為全球戰(zhàn)略競爭的新焦點。截至目前,我國數(shù)據(jù)中心規(guī)模已達 500 萬標(biāo)準(zhǔn)機架,算力達到 130 EFLOPS(每秒一萬三千億億次浮點運算)。隨著數(shù)字技術(shù)向經(jīng)濟社會各領(lǐng)域全面持續(xù)滲透,全社會對算力需求仍十分迫切,預(yù)計每年仍將以 20% 以上的速度快速增長。
從 2020 年 12 月發(fā)布《關(guān)于加快構(gòu)建全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系的指導(dǎo)意見》,到 2021 年 5 月印發(fā)的《全國一體化大數(shù)據(jù)中心協(xié)同創(chuàng)新體系算力樞紐實施方案》,再到 2022 年 2 月 17 日,國家發(fā)改委、中央網(wǎng)信辦、工業(yè)和信息化部、國家能源局四部委聯(lián)合印發(fā)通知,同意在京津冀、長三角、粵港澳大灣區(qū)、成渝、內(nèi)蒙古、貴州、甘肅、寧夏等 8 地啟動建設(shè)國家算力樞紐節(jié)點,并規(guī)劃了 10 個國家數(shù)據(jù)中心集群。至此,全國一體化大數(shù)據(jù)中心體系完成總體布局設(shè)計,“東數(shù)西算”工程正式全面啟動。
在需求與政策的雙重驅(qū)動下,全國各地大力推進算力基礎(chǔ)設(shè)施建設(shè)布局,超算中心、智算中心迅速成為新基建熱點。
建好管好用好 面對多項挑戰(zhàn)
數(shù)字經(jīng)濟發(fā)展推動下,我國算力產(chǎn)業(yè)建設(shè)處于發(fā)展迅猛階段。但與世界上計算產(chǎn)業(yè)成熟、算力水平領(lǐng)先的國家相比,現(xiàn)階段我國算力產(chǎn)業(yè)要建好、管好、用好,還面臨諸多挑戰(zhàn)。
自主創(chuàng)新
國家信息化建設(shè)關(guān)乎社會經(jīng)濟與人民生活等多方面的發(fā)展,算力中心承載著許多科研開發(fā)、政府治理以及行業(yè)應(yīng)用,因此數(shù)據(jù)安全尤其重要。在信息安全等級保護政策指導(dǎo)下,只有實現(xiàn)底層技術(shù)的自主創(chuàng)新,才能保證信息產(chǎn)業(yè)的穩(wěn)定、健康發(fā)展。
硬件多樣適配難
不同行業(yè)、不同場景對 IT 基礎(chǔ)設(shè)施的要求越來越精細(xì)化,算力中心承載的業(yè)務(wù)越來越多樣化,硬件逐漸朝多元化的方向發(fā)展,如何高效、統(tǒng)一地適配和調(diào)度這些硬件將會是一個巨大的挑戰(zhàn)。
算力需求多樣化
新一輪科技革命和數(shù)字產(chǎn)業(yè)變革帶來的激烈競爭前所未有,科研開發(fā)、云計算、人工智能、大數(shù)據(jù)、區(qū)塊鏈等新興技術(shù)的高速發(fā)展,背后都需要算力的支撐。面對大量異構(gòu)、跨平臺的算力資源,如果無法形成統(tǒng)一的算力服務(wù),那么用戶將面對在多個平臺間進行切換和使用,學(xué)習(xí)和運維成本極高。
應(yīng)用開發(fā)及管理難
基礎(chǔ)硬件設(shè)施和算力類型的多樣化,必然也會導(dǎo)致底層算力平臺的結(jié)構(gòu)與技術(shù)差異化。平臺間沒有統(tǒng)一開發(fā)規(guī)范,開發(fā)人員在應(yīng)用開發(fā)過程中,往往需要花費大量精力去適配不同的運行環(huán)境,以確保應(yīng)用的可用性和穩(wěn)定性,從而增大應(yīng)用開發(fā)難度。
服務(wù)模式不夠靈活
當(dāng)前工業(yè)、醫(yī)藥等越來越多的行業(yè),需要用到高性能計算來解決生產(chǎn)中遇到的問題。高性能計算服務(wù)缺少面向大眾的服務(wù)運營平臺的弊端就凸顯了出來:資源池固定無法做到靈活調(diào)配、資源開通需要手動審批、共用登錄點、資源搶占問題,用戶在軟件安裝上也有諸多限制等。
運維難度高
無論是提供高性能計算服務(wù)的超算中心,還是傳統(tǒng)數(shù)據(jù)中心建設(shè)規(guī)模都越來越龐大,結(jié)構(gòu)越來越復(fù)雜。運維這些大型異構(gòu)算力平臺,繼續(xù)采用傳統(tǒng)的人力運維,已經(jīng)很難趕上算力中心的建設(shè)步伐。
迎接下一代“算力創(chuàng)新”
原有的算力基礎(chǔ)設(shè)施,更多是針對不同場景特點打造專用的算力平臺,如傳統(tǒng)的超算中心、云計算中心,它們并不能很好地在統(tǒng)一的管理框架下同時滿足多種算力需求,并且解決以上各種挑戰(zhàn)。基于此,青云科技提供了全新的解決方案,打造了新一代的超級智算平臺。
超級智算平臺
青云科技以基于虛擬化、容器等技術(shù)實現(xiàn)對算力與底層基礎(chǔ)設(shè)施的解耦,通過統(tǒng)一的云操作系統(tǒng)對底層資源進行納管和協(xié)同編排,構(gòu)建了支持多元算力的超級智算平臺,實現(xiàn)多元算力的統(tǒng)一協(xié)調(diào)管理及協(xié)同工作,最大化地發(fā)揮多元算力的作用。
自主創(chuàng)新的算力平臺
當(dāng)前“新基建”與“數(shù)字經(jīng)濟”背景下,算力中心將會發(fā)展為國家的數(shù)字中心樞紐,這當(dāng)中算力平臺作為 IT 基礎(chǔ)硬件設(shè)施的融合層,毫無疑問是重要的一環(huán)。
青云與眾多信創(chuàng)芯片、操作系統(tǒng)、服務(wù)器、數(shù)據(jù)庫、中間件等上下游廠商達成深度合作,積極完成產(chǎn)品的兼容適配。超級智算平臺能夠提供全棧信創(chuàng)云計算的服務(wù)能力,屏蔽底層信創(chuàng)硬件差異,幫助企業(yè)從零構(gòu)建 laaS、PaaS 并提供一整套應(yīng)用開發(fā)、交付與運營平臺。
云計算賦能多元算力一站式交付
青云超級智算平臺利用云計算技術(shù)實現(xiàn)對多種主流的 CPU、GPU、NPU、FPGA 等異構(gòu)算力統(tǒng)一分配和調(diào)度,并且具備將異構(gòu)算力統(tǒng)一封裝提供服務(wù)的能力。利用云計算技術(shù)為算力中心賦能,一站式提供多種算力服務(wù):通用云計算服務(wù)、高性能計算云服務(wù)、AI算力服務(wù)。
超級智算云原生平臺
青云超級智算平臺基于 KubeSphere 構(gòu)建了以應(yīng)用為中心的分布式、多租戶、多集群、企業(yè)級容器平臺,具有強大且完善的網(wǎng)絡(luò)與存儲能力,并通過極簡的人機交互提供完善的多集群管理、CI/CD、微服務(wù)治理、應(yīng)用管理等功能,與 HPC 平臺相融合,在云、虛擬化及物理機等異構(gòu)基礎(chǔ)設(shè)施上快速構(gòu)建、部署及運維容器架構(gòu),實現(xiàn)應(yīng)用的敏捷開發(fā)與全生命周期管理。
應(yīng)用商店支撐統(tǒng)一應(yīng)用交付
青云超級智算平臺以融合架構(gòu)計算系統(tǒng)為平臺,以數(shù)據(jù)為資源,能夠以多元算力驅(qū)動計算模型對數(shù)據(jù)進行深度加工,源源不斷產(chǎn)生各種智慧計算服務(wù),集成各場景業(yè)務(wù)軟件,通過統(tǒng)一的應(yīng)用商店,支撐各行各業(yè)應(yīng)用場景。
目前,應(yīng)用商店中已集成涉及生物信息與生物學(xué)、大氣海洋環(huán)境、機械工程、數(shù)學(xué)庫、化學(xué)工程、程序語言、編譯器、MPI 等多種業(yè)務(wù)場景、多類學(xué)科、多種程序語言的應(yīng)用軟件,平臺軟件庫規(guī)模已達 300+,其他各類應(yīng)用場景軟件還在不斷更新中。
依托 IoT 物聯(lián)網(wǎng)技術(shù)打造智慧數(shù)據(jù)中心
青云QingCloud 借助數(shù)字化技術(shù),利用一整套貫穿數(shù)據(jù)中心的規(guī)劃、設(shè)計、建設(shè)、運維全生命周期的智慧化管理方法來支撐,設(shè)計智慧數(shù)據(jù)中心解決方案,打造全數(shù)字化的數(shù)據(jù)中心智能管理平臺。
依托 IoT 物聯(lián)網(wǎng)技術(shù)可以對海量設(shè)備進行數(shù)字化管理,實現(xiàn)基于物聯(lián)大數(shù)據(jù)的全景智算中心監(jiān)控,圍繞 IDC 設(shè)施管理、能耗與動環(huán)管理、智慧運維、智慧運營四大板塊,建設(shè)“統(tǒng)一管理、智能聯(lián)動、流程規(guī)范”的開放能力平臺,實現(xiàn)超級智算中心的智慧化賦能,從硬件和軟件、技術(shù)和管理多個層面促進數(shù)據(jù)中心能效提升。
國家超算濟南中心的創(chuàng)新發(fā)展之路
自 2019 年起,國家超算濟南中心實施規(guī)劃——打造全新的百億億次異構(gòu)融合算力平臺,以滿足日益旺盛的“新基建”需求。目標(biāo)是迅速聚集各類創(chuàng)新資源,持續(xù)完善超算應(yīng)用服務(wù)產(chǎn)業(yè)生態(tài)鏈,滿足人工智能產(chǎn)業(yè)的全方位需求,一站式提供多種算力平臺,打通“產(chǎn)”、“學(xué)”、“研”環(huán)節(jié)的快速轉(zhuǎn)換通道。同時也為后續(xù)的算力網(wǎng)絡(luò)發(fā)展做好布局。為國家超算濟南中心打造新一代超級智算平臺的重任榮幸地落在青云科技身上。
青云科技為國家超算濟南中心打造的新一代超級智算平臺實現(xiàn)了融合多種異構(gòu)算力平臺、一站式統(tǒng)一管理、跨平臺的便捷應(yīng)用部署,這些特點都為濟南超算中心提供全面、優(yōu)質(zhì)的數(shù)據(jù)服務(wù)提供了良好的基礎(chǔ),也可以為其他超算中心的發(fā)展起到示范性作用。
算力已成為國民經(jīng)濟發(fā)展的重要基礎(chǔ)設(shè)施。加快推動算力建設(shè),將有效激發(fā)數(shù)據(jù)要素創(chuàng)新活力,加速數(shù)字產(chǎn)業(yè)化和產(chǎn)業(yè)數(shù)字化進程,催生新技術(shù)、新產(chǎn)業(yè)、新業(yè)態(tài)、新模式,支撐經(jīng)濟高質(zhì)量發(fā)展。青云科技積極布局和參與,打造新一代超級智算平臺解決方案,幫助社會建好、管好、用好算力基礎(chǔ)設(shè)施。