大模型的發(fā)展正推動(dòng)AI算力市場(chǎng)進(jìn)入新的發(fā)展階段,強(qiáng)大的AIGC算力基礎(chǔ)設(shè)施正在構(gòu)建當(dāng)中。近日,甲子光年智庫(kù)推出《中國(guó)AIGC產(chǎn)業(yè)算力發(fā)展報(bào)告》,在瞬息萬狀的AIGC產(chǎn)業(yè)發(fā)展過程中,對(duì)AIGC產(chǎn)業(yè)引發(fā)的算力資源需求變化進(jìn)行觀察與思考。
UCloud優(yōu)刻得是中立、安全的云廠商,通過多年的公有云技術(shù)沉淀和系統(tǒng)工程能力,在大模型爆發(fā)之初就快速升級(jí)基礎(chǔ)設(shè)施,并與多家大模型頭部公司緊密配合,聯(lián)合打磨產(chǎn)品和方案,推出了涵蓋大模型“訓(xùn)練集群+推理集群+存儲(chǔ)+管理”的完備云服務(wù)解決方案?;?ldquo;算力+模型+平臺(tái)”的服務(wù)模式,為AIGC領(lǐng)域構(gòu)筑安全可靠的智算底座,全面擁抱大模型的發(fā)展浪潮。
作為AIGC產(chǎn)業(yè)算力領(lǐng)域的領(lǐng)航者,UCloud優(yōu)刻得智算中心、云服務(wù)、大模型一體機(jī)入選AIGC產(chǎn)業(yè)算力服務(wù)商圖譜。完整版報(bào)告獲取,請(qǐng)關(guān)注公眾號(hào)「UCloud云計(jì)算」,后臺(tái)回復(fù)“AIGC”。
報(bào)告核心思路和觀點(diǎn):
●大模型訓(xùn)練是復(fù)雜系統(tǒng)工程,AIGC產(chǎn)業(yè)的算力對(duì)應(yīng)的也是系統(tǒng)化的建設(shè),需要從工程化的角度思考算力的全局“利用率”。
●算力不僅局限于單一產(chǎn)品/服務(wù),AIGC算力的核心提供企業(yè)包括云服務(wù)、大模型一體機(jī)、智算中心、服務(wù)器及計(jì)算芯片服務(wù)商等。
●AIGC正處于早期快速發(fā)展階段,訓(xùn)練端是目前算力的討論熱點(diǎn),但不應(yīng)忽視AIGC的商業(yè)突破要依賴推理側(cè)的發(fā)展及算力支持。
●AIGC不是單純地拉動(dòng)算力規(guī)模,而是會(huì)改變算力產(chǎn)業(yè)的發(fā)展思路,例如MaaS對(duì)云服務(wù)模式的影響,云邊協(xié)同的效力體現(xiàn),及存算一體技術(shù)的發(fā)展等等。
>AIGC產(chǎn)業(yè)的算力是工程化的結(jié)果
未來大模型的產(chǎn)業(yè)化發(fā)展是一套復(fù)雜的系統(tǒng)工程,構(gòu)建高效穩(wěn)定的算力平臺(tái)是核心要義,成熟的算法、數(shù)據(jù)產(chǎn)業(yè)鏈,配套工具鏈及豐富的生態(tài)鏈均成為關(guān)鍵因素。
UCloud優(yōu)刻得認(rèn)為,當(dāng)前大模型發(fā)展面臨著諸多痛點(diǎn):
1. 大規(guī)模分布式算力集群是大模型訓(xùn)練的基本要求,當(dāng)前國(guó)內(nèi)對(duì)大算力集群的需要呈現(xiàn)井噴式涌現(xiàn),大規(guī)模集群算力存在較大缺口。
2. 訓(xùn)練集群GPU服務(wù)器之間需要高速網(wǎng)絡(luò)互聯(lián),RoCE網(wǎng)絡(luò)方案具有成本優(yōu)勢(shì),但依賴工程經(jīng)驗(yàn),需要針對(duì)大模型場(chǎng)景進(jìn)行專門的適配和優(yōu)化。
3. 在大模型的訓(xùn)練過程,對(duì)存儲(chǔ)系統(tǒng)也有著較強(qiáng)依賴,有著高讀寫吞吐的要求。
4. 大模型集群建設(shè)成本高,優(yōu)化資源利用率是降低成本的核心手段,需要高效的資源調(diào)度能力和故障處理能力。
5. ……
>尋找AIGC產(chǎn)業(yè)落地的智能算力實(shí)踐
報(bào)告指出,算力資源的維度不僅包括算力規(guī)模大小,還要考慮算力部署及運(yùn)營(yíng)過程中可以利用的程度。算力是工程化結(jié)果,是從芯片到資源服務(wù)的多層次構(gòu)造,需要算力服務(wù)方自身在自身專業(yè)能力及經(jīng)驗(yàn)案例上的實(shí)際Know-How作為基礎(chǔ)。不同需求程度的用戶不能唯算力的參數(shù)而論,而是要結(jié)合自身對(duì)于算力部署的能力進(jìn)行進(jìn)一步探究。
UCloud優(yōu)刻得表示,在前期大多數(shù)算力需求為訓(xùn)練任務(wù),推理只占少數(shù)。隨著大模型市場(chǎng)的競(jìng)爭(zhēng)格局逐漸穩(wěn)固,頭部模型公司凸顯,訓(xùn)練算力會(huì)集中在這些公司,而其余業(yè)務(wù)則會(huì)直接使用這些公司的大模型進(jìn)行推理,推理算力的比例逐漸攀升。同樣,伴隨著Llama 2的權(quán)重開源、代碼開源在中長(zhǎng)期也會(huì)掀起垂直模型生成的微調(diào)算力需求。
>UCloud優(yōu)刻得大模型算力集群解決方案
UCloud優(yōu)刻得具備從數(shù)據(jù)中心、計(jì)算平臺(tái),到管理平臺(tái)、網(wǎng)絡(luò)服務(wù)、應(yīng)用服務(wù)、生態(tài)接口等一站式產(chǎn)品和解決方案。憑借“東數(shù)西算”兩大低成本、高附加值的自建數(shù)據(jù)中心,充分利用西部數(shù)據(jù)中心在能源配套和電力成本、算力資源方面的優(yōu)勢(shì),基于公有云的產(chǎn)品棧和系統(tǒng)工程實(shí)踐,UCloud優(yōu)刻得在底層通過GPU云主機(jī)、裸金屬等構(gòu)建算力單元,以US3、UFS構(gòu)建存儲(chǔ)池,聯(lián)動(dòng)RoCE、IB的高性能網(wǎng)絡(luò),并在業(yè)務(wù)層使用UK8S進(jìn)行任務(wù)調(diào)度,從而為大模型企業(yè)構(gòu)建完備的訓(xùn)推一體平臺(tái)。而東部的青浦?jǐn)?shù)據(jù)中心則主要用于覆蓋長(zhǎng)三角區(qū)域,更加適用于對(duì)延時(shí)敏感的推理任務(wù)。
同時(shí),為加速垂直大模型的行業(yè)落地,UCloud優(yōu)刻得基于開箱即用的私有化大模型一體機(jī),與合作伙伴探索提供一站式MaaS服務(wù)。目前UCloud優(yōu)刻得鏡像市場(chǎng)支持Alpaca-LoRA7B、T5、MiniGPT-4、ChatGLM、Ziya、Llama 2以及Milvus向量數(shù)據(jù)庫(kù)等開源大模型,覆蓋知識(shí)推理、問答、圖文生成、中文語義及繪畫設(shè)計(jì)等AI應(yīng)用領(lǐng)域,可為用戶快速搭建大模型的微調(diào)或推理環(huán)境。
當(dāng)前,UCloud優(yōu)刻得也在通過內(nèi)部孵化AIGC項(xiàng)目實(shí)踐,推出“識(shí)問”智能助手平臺(tái),UCoder代碼助手平臺(tái),AI繪畫助手平臺(tái)、大模型安全管理平臺(tái),并且優(yōu)化模型微調(diào)、模型推理等流程,持續(xù)提升系統(tǒng)工程能力和服務(wù)經(jīng)驗(yàn)積累,幫助大模型企業(yè)實(shí)現(xiàn)高效能的資源利用。
>AIGC時(shí)代才剛剛開始
8月31日,國(guó)內(nèi)首批8家通過《生成式人工智能服務(wù)管理暫行辦法》備案的AI大模型產(chǎn)品陸續(xù)上線,面向全社會(huì)提供服務(wù)。開放的大模型產(chǎn)品包括百度「文心一言」、百川智能「百川大模型」、智譜AI「智譜清言」、中科院「紫東太初」、抖音「云雀」、 商湯「商量SenseChat」、MiniMax「ABAB大模型」和上海人工智能實(shí)驗(yàn)室「書生通用大模型」,其中不乏UCloud優(yōu)刻得正在合作的大模型客戶,半數(shù)企業(yè)使用了UCloud優(yōu)刻得提供的GPU算力服務(wù)。
伴隨著國(guó)產(chǎn)大模型的相繼開放,將推動(dòng)國(guó)產(chǎn)大模型生態(tài)的不斷完善。AIGC時(shí)代才剛剛開始,技術(shù)和垂直應(yīng)用方向尚有大量機(jī)會(huì)。UCloud優(yōu)刻得將持續(xù)發(fā)揮中立、安全云計(jì)算平臺(tái)的賦能價(jià)值,為助力AIGC產(chǎn)業(yè)發(fā)展打造穩(wěn)定可靠的大模型智算底座,加速人工智能應(yīng)用落地。