日前,SciPlus科研云于上海浦江創(chuàng)新論壇正式發(fā)布。作為行業(yè)云解決方案,SciPlus科研云基于云計(jì)算技術(shù)構(gòu)建,具有資源共享、彈性收縮等云平臺(tái)共性,專注于管理與存儲(chǔ),將計(jì)算資源和數(shù)據(jù)資源合理高效整合到云端,包括多云異構(gòu)云管平臺(tái)、通用分布式計(jì)算框架、流式編程計(jì)算框架,為科研工作者提供科研數(shù)據(jù)的計(jì)算分析能力與數(shù)據(jù)共享、學(xué)科領(lǐng)域數(shù)據(jù)庫(kù)建設(shè)、科研協(xié)同協(xié)作等服務(wù)。
作為SciPlus科研云的重要技術(shù)合作伙伴,青云QingCloud CEO黃允松受邀出席發(fā)布儀式,并發(fā)表主題演講《科研加速器——軟件定義的多維云計(jì)算》,本文根據(jù)演講內(nèi)容整理。
在中國(guó)有一個(gè)非常熱門話題——"下一代汽車"。如果你開過特斯拉,就會(huì)知道,駕駛汽車的體驗(yàn)就像是在駕駛iPhone。傳統(tǒng)汽車行業(yè)也在改變,即使最傳統(tǒng)的GM通用汽車也無例外。對(duì)"下一代汽車"的投入,最重要的崗位就是軟件工程師。簡(jiǎn)單來說,汽車公司會(huì)變成軟件公司,汽車功能都會(huì)解耦成各種組件,而在科研中也有類似的情況。
軟件定義無處不在
回顧軟件定義的發(fā)展,軟件定義網(wǎng)絡(luò)差不多是十年前開始的。在此之前,已經(jīng)開始的是軟件定義服務(wù)器。做科研一定要用服務(wù)器,但是在數(shù)據(jù)傳輸過程中也一定要用到網(wǎng)絡(luò)。越來越多科研設(shè)備接入,網(wǎng)絡(luò)能力變得至關(guān)重要。青云QingCloud 從創(chuàng)立之初就在建設(shè)軟件定義網(wǎng)絡(luò)的能力。
整個(gè)SDN(軟件定義網(wǎng)絡(luò))體系發(fā)展過程,就是將傳統(tǒng)的交換和路由功能從硬件轉(zhuǎn)變?yōu)檐浖焖龠M(jìn)行迭代創(chuàng)新。SDN的工作邏輯,是讓軟件駕馭數(shù)據(jù)轉(zhuǎn)發(fā)和數(shù)據(jù)控制,使創(chuàng)新成本幾乎為零。以手機(jī)為例,現(xiàn)在的智能手機(jī)沒有鍵盤;以前有鍵盤的時(shí)代,研發(fā)鍵盤并開模的周期長(zhǎng)、成本高、調(diào)節(jié)難度大;現(xiàn)在將鍵盤變成軟件之后,鍵盤來自于輸入法提供商,創(chuàng)新成本幾乎為零。
網(wǎng)絡(luò)從單域模式拓展到多域,需要實(shí)現(xiàn)跨邊界的網(wǎng)絡(luò)連接。以前需要昂貴的設(shè)備,現(xiàn)在只要一套軟件,大概率還是開源軟件。這讓調(diào)節(jié)成本變得非常低,并且問題修復(fù)和升級(jí)不需要涉及硬件的更換。
從單一實(shí)驗(yàn)室到多個(gè)實(shí)驗(yàn)室,從一個(gè)省份到多個(gè)省份,從一個(gè)國(guó)家到多個(gè)國(guó)家,需要跨越局域網(wǎng)絡(luò)成為廣域網(wǎng)絡(luò),新一代的SDN就是SD-WAN,當(dāng)然還會(huì)繼續(xù)演進(jìn)。現(xiàn)在廣域網(wǎng)的路由從數(shù)據(jù)中心推到移動(dòng)端,我們?cè)谑謾C(jī)和Pad 上就可以操作,讓網(wǎng)絡(luò)更加貼近實(shí)際需求,靠的就是軟件定義。
科學(xué)研究正在改變
如何能拿到盡量多的數(shù)據(jù)?要靠物聯(lián)網(wǎng)和邊緣計(jì)算。對(duì)疾病防治及其他科學(xué)的研究需要大量數(shù)據(jù)的輸入,靠人工去收集數(shù)據(jù)不太現(xiàn)實(shí),靠傳感器收集的方式更加快速、及時(shí)。傳感器通過多樣化的連接,到達(dá)邊緣端。大量數(shù)據(jù)通過物聯(lián)網(wǎng)平臺(tái)接入到數(shù)據(jù)庫(kù)里的結(jié)構(gòu)化或者非結(jié)構(gòu)化的存儲(chǔ)介質(zhì)里,在云端進(jìn)行分析,這個(gè)過程稱之為"訓(xùn)練"。訓(xùn)練的結(jié)果,在人工智能領(lǐng)域叫模型,在科學(xué)領(lǐng)域就是"結(jié)論"。比如說,分叉樹怎么分叉的,這個(gè)模型有版本,一個(gè)版本在迭代中有不同代際,進(jìn)行版本標(biāo)注之后,信息下發(fā)至邊緣側(cè)的終端上,當(dāng)類似情況再出現(xiàn)時(shí),可以自動(dòng)發(fā)現(xiàn)和識(shí)別。
自動(dòng)化過程變得很關(guān)鍵,算力足夠、存儲(chǔ)足夠,最重要的是足夠廉價(jià)。我們經(jīng)常到全國(guó)各地出差或者旅游,會(huì)發(fā)現(xiàn)疫情防治的檢測(cè)繁重、成本高、有效性低,通過人工智能及大數(shù)據(jù)的技術(shù)方案,成本變得很低,有效性也能得到提升,進(jìn)一步推動(dòng)資源投入到更加底層的病毒研究,使模型更精確。
容器提升數(shù)據(jù)處理能力
通過網(wǎng)絡(luò)連接得到的數(shù)據(jù),在云端處理邏輯有很多方式。比如,科研工作者常用的HPC(高性能計(jì)算),屬于傳統(tǒng)的計(jì)算方法;還有新興方法,將容器用于對(duì)無狀態(tài)型大量數(shù)據(jù)的并發(fā)式處理及流式處理。向云原生時(shí)代過渡,容器屬于計(jì)算領(lǐng)域的基礎(chǔ)設(shè)施。以前科學(xué)家們做數(shù)據(jù)處理買的就是服務(wù)器,后來是虛擬機(jī),現(xiàn)在基本上是容器。在極短的時(shí)間內(nèi)處理數(shù)以億計(jì)的數(shù)據(jù)就是依靠這樣并行的方式,對(duì)工作拆分再拆分。
如果科學(xué)形成割裂式的研究,一個(gè)團(tuán)隊(duì)只做自己的計(jì)算集群,得到的結(jié)果是沒有意義的。比如,耳垂折痕和一個(gè)基因組MRPS22相關(guān),同時(shí)這個(gè)基因又和心臟病相關(guān)的,如果沒有數(shù)據(jù)交叉與分享,這個(gè)體征和心臟病就不能聯(lián)系起來。科學(xué)一定是交叉的,支持科研的云形態(tài)變得至關(guān)重要。
云計(jì)算行業(yè)的演進(jìn)過程很簡(jiǎn)單。最早是2004年3月,硅谷創(chuàng)業(yè)教父Paul Graham提出的"軟件吞噬世界",軟件帶來了開源。接下來是云計(jì)算,現(xiàn)在是云原生時(shí)代,并行能力變強(qiáng),加上存儲(chǔ)與網(wǎng)絡(luò)的能力,讓數(shù)據(jù)處理過程變得更快,幫助科研工作者節(jié)省大量時(shí)間,在數(shù)據(jù)中找到邏輯和關(guān)聯(lián)性。
從"軟件定義"到"數(shù)字孿生"
要特別提一下"數(shù)字孿生"。舉例來說,港口做危險(xiǎn)品檢測(cè),之前主要靠經(jīng)驗(yàn)數(shù)據(jù),是二維的,復(fù)雜的。做數(shù)字孿生就變得很簡(jiǎn)單,港口原封不動(dòng)地呈現(xiàn)在屏幕上,因?yàn)橛泻芏鄶?shù)字化設(shè)施和傳感器安裝在港口的角角落落,把港口幾乎100% 還原在屏幕上,和真實(shí)世界一樣,并且每個(gè)環(huán)節(jié)是可編碼的。
將物理事件在線上進(jìn)行純數(shù)字化還原,稱之為數(shù)字孿生。這個(gè)模式對(duì)科學(xué)研究非常有效,比如說病毒,無論原宿主還是中間傳播者,通過數(shù)字孿生方式做到非常接近真實(shí)的還原,追溯效率極高。
開源是全世界的基礎(chǔ)架構(gòu)技術(shù)協(xié)作
以前,我們大部分中國(guó)人對(duì)開源是沒有概念的,但整個(gè)計(jì)算機(jī)行業(yè)完全靠開源推動(dòng)。信息行業(yè)作為一個(gè)年輕行業(yè),之所以發(fā)展快,關(guān)鍵在于開源帶來的高協(xié)作性。
現(xiàn)在,越來越多人認(rèn)識(shí)到開源的重要性,開源對(duì)中國(guó)來說更加重要,需要強(qiáng)調(diào)的是"開源是全世界的基礎(chǔ)架構(gòu)技術(shù)協(xié)作"。因?yàn)榛A(chǔ)架構(gòu)不會(huì)存在國(guó)別,就像音樂一樣,一定是全球一體化的。所以青云QingCloud都是通過全球化運(yùn)作方式運(yùn)作所有開源基礎(chǔ)架構(gòu)技術(shù),前面提到的容器項(xiàng)目KubeSphere,從第一天就是這個(gè)理念。
云計(jì)算對(duì)GDP具有高度的正向推動(dòng),對(duì)科學(xué)研究亦是如此。實(shí)際上在新冠疫情中,我們已經(jīng)看到很多領(lǐng)域的研究都是大量使用分布式做數(shù)據(jù)處理,帶來了巨大便利。進(jìn)入云原生時(shí)代,云計(jì)算作為新基石,一定會(huì)發(fā)揮更大的作用。