9月19日,青云科技發(fā)布針對AI算力全新推出的全棧產(chǎn)品與服務(wù),正式推出AI算力調(diào)度平臺(tái)與AI算力云服務(wù)。青云科技總裁林源在發(fā)布會(huì)和采訪中闡述了AI將給應(yīng)用和算力帶來的變化,他認(rèn)為“AI領(lǐng)域一定會(huì)出現(xiàn)巨頭,但不是一家獨(dú)立的公司,而是一個(gè)小的生態(tài)。”
AI驅(qū)動(dòng)應(yīng)用與算力變革 智算中心迎挑戰(zhàn)
自2022年底ChatGPT橫空出世至今,國際與國內(nèi)科技公司紛紛展開競逐,以大模型為代表的AIGC在全球引發(fā)了新一波AI浪潮。
每一次科技創(chuàng)新都給生產(chǎn)生活方式帶來變革,正如移動(dòng)互聯(lián)網(wǎng)開啟萬物互聯(lián),云計(jì)算讓企業(yè)IT遷徙上云,每一次科技創(chuàng)新都給生產(chǎn)生活方式帶來變革。得益于AI高效的生產(chǎn)力與簡單的交互方式,青云科技總裁林源認(rèn)為,新一波AI浪潮在帶來生產(chǎn)力變革的同時(shí),還將帶來商業(yè)模式、應(yīng)用門檻、底層架構(gòu)等眾多變革,產(chǎn)生大量新市場機(jī)會(huì)。
他表示,相較于過去十年,AI驅(qū)動(dòng)應(yīng)用呈現(xiàn)四大變化:首先,移動(dòng)互聯(lián)網(wǎng)、數(shù)字化的服務(wù)應(yīng)用場景,轉(zhuǎn)變?yōu)樗袘?yīng)用都要擁抱AI或被AI改造,企業(yè)數(shù)智化取代數(shù)字化;第二,從以CPU為核心變?yōu)橐訥PU為核心驅(qū)動(dòng)應(yīng)用的創(chuàng)新,“未來的時(shí)代一定是一個(gè)以GPU為核心的時(shí)代”;第三,由于AI訓(xùn)練成本極高,未來AI應(yīng)用由延遲敏感型轉(zhuǎn)變?yōu)橐猿杀久舾行蜑橹鳎瑢?yīng)的算力將從延遲低的東部沿海,向價(jià)格更便宜的西部地區(qū)發(fā)展,未來算力分布更加分散;第四,支撐的應(yīng)用類型變化,由傳統(tǒng)應(yīng)用和云原生應(yīng)用,轉(zhuǎn)變?yōu)樵圃鷳?yīng)用+AI應(yīng)用,客戶業(yè)務(wù)更復(fù)雜,業(yè)態(tài)更豐富,對技術(shù)和平臺(tái)的挑戰(zhàn)越來越多。
過去半年中,隨著大模型產(chǎn)品的爆發(fā),AI帶來的變革已經(jīng)逐漸凸顯,其中作為AI應(yīng)用承載的算力格局變化尤為明顯。
中國信通院發(fā)布的《中國綜合算力指數(shù)(2023年)》顯示,截至2023年6月底,我國算力總規(guī)模達(dá)到197EFLOPS,其中智能算力規(guī)模占整體算力規(guī)模的比例提高到25.4%,智能算力規(guī)模同比增長達(dá)45%,比算力規(guī)模整體增速高15個(gè)百分點(diǎn)。
AI熱潮下,眾多智算中心項(xiàng)目如雨后春筍般落地開工,國家信息中心與相關(guān)部門聯(lián)合發(fā)布的《智能計(jì)算中心創(chuàng)新發(fā)展指南》顯示,目前全國有超過30個(gè)城市正在建設(shè)或提出建設(shè)智算中心。
在建設(shè)如火如荼的同時(shí),智算中心也存在隱憂。林源指出,當(dāng)前智算中心面臨多方面挑戰(zhàn)。
對于智算中心的主要建設(shè)者地方政府、國資央企和地方AI集成商來說,首要挑戰(zhàn)是成本和技術(shù)。智算中心投資巨大,一臺(tái)最新的NVIDIA的服務(wù)器就要兩百萬,未來能否收回成本以及盈利,取決于運(yùn)營效率與平臺(tái)能力,前者降低成本,后者決定能賣給多少客戶。而相比于投資與建設(shè),智算中心的運(yùn)營更專業(yè)復(fù)雜,目前各中心運(yùn)營能力參差不齊,難以應(yīng)對。
他直言:“行業(yè)內(nèi)大家對于‘智算中心要怎么建?建成什么樣?未來要支撐什么業(yè)務(wù)?’并沒有想的很透徹。”因此造成了有智算功能的某計(jì)算中心建成后,由于只支持特定GPU,所以缺乏客戶,運(yùn)營不起來的情況。
應(yīng)需而生 實(shí)踐落地 青云AI算力調(diào)度平臺(tái)發(fā)布
新一波AI熱潮下,智能算力規(guī)模將迎來更加快速的增長,智算中心如何設(shè)計(jì)規(guī)劃,實(shí)現(xiàn)兼顧AI應(yīng)用、云原生應(yīng)用與傳統(tǒng)應(yīng)用需求,支持異構(gòu)CPU/GPU,高效運(yùn)營達(dá)到盈利?
青云的答案是青云AI算力調(diào)度平臺(tái)。
青云科技產(chǎn)品經(jīng)理苗慧表示,青云AI算力調(diào)度平臺(tái)是包括智算中心在內(nèi)的算力中心建設(shè)的新模式,讓算力中心像管理本地資源一樣管理AI基礎(chǔ)設(shè)施,實(shí)現(xiàn)多元算力統(tǒng)一調(diào)度、智能化算力管理,支持大模型訓(xùn)練場景,提供多種AIGC模型的一站式交付平臺(tái),支撐行業(yè)應(yīng)用計(jì)算、高性能計(jì)算、AI計(jì)算等多種應(yīng)用模式。
青云AI算力調(diào)度平臺(tái)具備九大關(guān)鍵能力:多區(qū)多業(yè)務(wù)資源整合、混合組網(wǎng)、容器推理服務(wù)平臺(tái)、分布式調(diào)度與管理、算法開發(fā)支持、模型倉庫(MaaS)、AI訓(xùn)練平臺(tái)、靈活調(diào)度、高速并行存儲(chǔ)。
相較于市面上其他算力調(diào)度產(chǎn)品,苗慧表示,青云AI算力調(diào)度平臺(tái)在資源靈活調(diào)度方面更具優(yōu)勢。
原因在于,青云針對大規(guī)模計(jì)算集群研發(fā)了更優(yōu)化的調(diào)度算法,所有節(jié)點(diǎn)、服務(wù)器和存儲(chǔ)設(shè)備都有路徑標(biāo)簽,通過算法計(jì)算最短鏈路,盡可能調(diào)度同一個(gè)交換機(jī)內(nèi)的兩個(gè)節(jié)點(diǎn),減少數(shù)據(jù)的傳輸損耗。此外,青云在應(yīng)用環(huán)境上使用K8s和Slurm兩種調(diào)度平臺(tái)同時(shí)為客戶服務(wù),可以實(shí)現(xiàn)提交分布式計(jì)算任務(wù)時(shí),相關(guān)卡、CPU、進(jìn)程等調(diào)度信息都能立刻獲取到,在顆粒度和運(yùn)維傳統(tǒng)機(jī)器等方面也有更多優(yōu)化。多措并舉,實(shí)現(xiàn)更好的算力調(diào)度,更好的資源利用。
“青云AI算力調(diào)度平臺(tái)的服務(wù)對象是現(xiàn)在和未來投入智算中心建設(shè)的企業(yè),算力中心現(xiàn)在的投資者和未來的運(yùn)營者。”
對算力中心來說,青云AI算力調(diào)度平臺(tái)使用效果如何,實(shí)踐案例最有說服力。
據(jù)林源介紹,青云AI算力調(diào)度平臺(tái)正式發(fā)布前,已經(jīng)在國家超級(jí)計(jì)算濟(jì)南中心(以下簡稱“濟(jì)南超算”)應(yīng)用,取得了良好效果。
濟(jì)南超算擁有超1000P算力,300P存儲(chǔ),是一個(gè)多元異構(gòu)算力中心,包括HPC、智算和以CPU為主的云計(jì)算,既有NVIDIA GPU,也考慮到國產(chǎn)化兼容,擁有一部分國產(chǎn)GPU。自3年前起,濟(jì)南超算的整個(gè)調(diào)度平臺(tái)由青云科技獨(dú)家供應(yīng),運(yùn)營至今,平穩(wěn)支撐濟(jì)南超算來自高校的傳統(tǒng)科學(xué)計(jì)算、政務(wù)云和企業(yè)數(shù)字化應(yīng)用上云、智慧城市、AI等多類客戶群體業(yè)務(wù),助力濟(jì)南超算提高算力資源利用,目前已經(jīng)實(shí)現(xiàn)盈利。
用林源的話說,濟(jì)南超算案例說明“青云AI算力調(diào)度平臺(tái)具備所說的能力,我們干過,而且干成了。”
AI算力云服務(wù) 構(gòu)建開放的生態(tài)同盟
發(fā)布會(huì)上,青云還正式發(fā)布了青云AI算力云服務(wù),介紹了青云AI生態(tài)合作伙伴體系。
林源表示,“青云AI算力云服務(wù)是以青云為主,對外運(yùn)營的一個(gè)AI算力服務(wù)”。獨(dú)特之處在于,該服務(wù)不是云廠商的獨(dú)角戲,而是定位為一個(gè)開放的生態(tài)同盟,青云與眾多合作伙伴一起聯(lián)營AI算力云。
采用生態(tài)方式運(yùn)營,源于AI市場邏輯的改變。他指出,過去的云計(jì)算十年中,服務(wù)商可以從底層的數(shù)據(jù)中心、硬件到軟件、PaaS都自建、自投、自營,但自己干的越多,研發(fā)費(fèi)用越高,成本越重。AI時(shí)代,做好每一層都需要長時(shí)間積累和巨大投入,所需成本遠(yuǎn)超此前,對于企業(yè)來說所有業(yè)務(wù)自己做難度極大成本太高。
與此同時(shí),對于客戶來說,他們希望獲得一個(gè)完整的解決方案,包括機(jī)房、算力、調(diào)度平臺(tái)、模型驅(qū)動(dòng)、模型、Model Service、上層應(yīng)用等所有。因此,林源認(rèn)為,在AI領(lǐng)域一定會(huì)出現(xiàn)巨頭,但不應(yīng)該是一家獨(dú)立的公司,而是一個(gè)小的生態(tài),聚合起來提供包含每一層的服務(wù),彼此開放,長期共贏。
青云AI算力云服務(wù)生態(tài)主要圍繞:AI 算力基礎(chǔ)設(shè)施的生態(tài)共享、AI 算力大模型的資源整合以及 AI 數(shù)據(jù)資源的生態(tài)整合。在這個(gè)生態(tài)中,青云只干自己最擅長的——AI算力調(diào)度平臺(tái)。
據(jù)發(fā)布會(huì)上展示,青云AI算力生態(tài)體系已初見雛形:AI算力組建生態(tài)囊括Intel、NVIDIA、AMD、中科曙光、天數(shù)智芯、燧原科技、中科馭數(shù)、大禹智芯等國內(nèi)外企業(yè);AI模型生態(tài)包括智譜清言、紫光太初2.0、商湯科技商量等多個(gè)大模型;算力服務(wù)生態(tài)既包括濟(jì)南超算、清華大學(xué)智算中心,也有中國電信這樣的算力供應(yīng)方;最上層已經(jīng)有金融、交通、制造業(yè)、能源、自然資源等行業(yè)應(yīng)用生態(tài)。
從對話的ChatGPT到生成照片的妙鴨相機(jī),AI已經(jīng)在多個(gè)領(lǐng)域展現(xiàn)了驚人的生產(chǎn)力與創(chuàng)造力,新一波AI大潮席卷而來,模型迭代迅速,智能算力建設(shè)與應(yīng)用落地加速,企業(yè)如何抓住市場新機(jī)遇,踏浪向前?
面對AI帶來的一系列變革,青云希望通過開放的、成熟的、可運(yùn)營的AI算力調(diào)度平臺(tái),通過自營、合營乃至支撐第三方運(yùn)營的方式,與生態(tài)同盟一起貢獻(xiàn)“AI Cloud”,共同前行。