10月26-27日,“2022 IDC中國未來企業(yè)大獎”頒獎典禮在第七屆IDC中國數(shù)字化轉(zhuǎn)型年度盛典上正式舉辦,由中國工商銀行數(shù)據(jù)中心申報的“中高算力GPU并行運算集群創(chuàng)新實踐項目”憑借領(lǐng)先的智能化算力調(diào)度、大模型分布式訓(xùn)練能力以及高性能可擴展的軟硬件系統(tǒng)設(shè)計,榮膺“未來數(shù)字基礎(chǔ)架構(gòu)領(lǐng)軍者”獎項。
“中國未來企業(yè)大獎”由全球權(quán)威IT市場研究和咨詢公司IDC (International Data Corporation,國際數(shù)據(jù)公司) 設(shè)立,旨在遴選中國各行業(yè)數(shù)字化轉(zhuǎn)型的最佳實踐,打造數(shù)字中國發(fā)展的風(fēng)向標(biāo)。其中,“未來數(shù)字基礎(chǔ)架構(gòu)領(lǐng)軍者”大獎則旨在評選出高效支撐數(shù)字化業(yè)務(wù)發(fā)展的基礎(chǔ)設(shè)施新標(biāo)桿。
浪潮信息助力AI大規(guī)模并行訓(xùn)練創(chuàng)新實踐
“中高算力GPU并行運算集群”由浪潮信息助力打造。隨著金融業(yè)數(shù)字化轉(zhuǎn)型加速推進,浪潮信息積極布局,以領(lǐng)先的AI計算系統(tǒng)與智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺,全力支持大型商業(yè)銀行在人工智能技術(shù)應(yīng)用領(lǐng)域探索傳統(tǒng)業(yè)務(wù)模式創(chuàng)新轉(zhuǎn)型,助力金融新業(yè)務(wù)新場景創(chuàng)新。
在AI算力基礎(chǔ)設(shè)施方面,浪潮信息的中高算力服務(wù)器采用單節(jié)點8-16張GPU卡的中高密度算力節(jié)點,提升GPU間通信性能,減少節(jié)點間網(wǎng)絡(luò)通信開銷,提升整體處理性能。同一個模型訓(xùn)練任務(wù),使用中高算力服務(wù)器運行不僅可以有效降低總能耗,同時可以減少機柜占用,提高集群算力密度,實現(xiàn)基礎(chǔ)資源降本增效。
在算力調(diào)度優(yōu)化方面,浪潮AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺助力構(gòu)建了高性能、高可靠、可擴展的軟硬件系統(tǒng)架構(gòu),實現(xiàn)了AI訓(xùn)練場景下算力資源的統(tǒng)一管理與智能化調(diào)度。浪潮AIStation是專為人工智能開發(fā)和部署提供全流程支持的端到端平臺,以強大的資源調(diào)度和管理能力助力客戶加速AI開發(fā)與部署,通過對計算資源、數(shù)據(jù)資源、深度學(xué)習(xí)軟件棧資源進行統(tǒng)一管理,全面提速AI開發(fā)應(yīng)用創(chuàng)新落地。高可靠的系統(tǒng)設(shè)計提供了多場景下故障容錯能力,故障發(fā)生時可自動觸發(fā)訓(xùn)練作業(yè)容錯漂移,不影響集群整體業(yè)務(wù)運行,有效保障金融級訓(xùn)練作業(yè)可靠運行。
在集群高速互聯(lián)方面,浪潮AIStation智能業(yè)務(wù)生產(chǎn)創(chuàng)新平臺的智能調(diào)度技術(shù)可以根據(jù)AI訓(xùn)練任務(wù)特性,自動匹配資源調(diào)度策略,實現(xiàn)對集群內(nèi)任意節(jié)點的任意GPU資源組合的自動化調(diào)度,有效提升了GPU并行運算集群對大模型分布式訓(xùn)練的支撐能力,并提高了集群算力的整體利用率。
在協(xié)同聯(lián)動方面,AIStation智能業(yè)務(wù)創(chuàng)新平臺的智能調(diào)度新技術(shù)能夠有效抑制多節(jié)點協(xié)同的性能損耗,隨著AI算力卡數(shù)的遞增,實現(xiàn)整體訓(xùn)練效率線性增長,有效支撐金融業(yè)大規(guī)模AI模型的創(chuàng)新發(fā)展。
AI技術(shù)創(chuàng)新加速驅(qū)動金融業(yè)務(wù)數(shù)字化轉(zhuǎn)型
目前,浪潮信息整體解決方案已經(jīng)在計算視覺領(lǐng)域的業(yè)務(wù)場景中完成應(yīng)用實踐,通過GPU并行計算能力和AI算力池化的統(tǒng)一調(diào)度,成功將典型AI模型的訓(xùn)練周期由1周下降為1個工作日,支持銀行AI業(yè)務(wù)場景快速上線。未來,中高算力GPU并行運算集群將為智能投顧、法律文審、智能風(fēng)控等計算量大、復(fù)雜度高的金融AI場景帶來更加可觀的業(yè)務(wù)效益。
中高算力GPU并行運算集群的落地,為金融行業(yè)前沿的大規(guī)模人工智能模型開發(fā)訓(xùn)練和場景應(yīng)用打下了堅實的技術(shù)基礎(chǔ)。未來,浪潮信息將繼續(xù)通過全棧智算能力賦能銀行業(yè)人工智能業(yè)務(wù)創(chuàng)新,深度推進金融業(yè)數(shù)字化轉(zhuǎn)型,賦能數(shù)字經(jīng)濟高質(zhì)量發(fā)展。