2022年4月,上海正處于嚴密的防疫封控期。UCloud技術團隊接到了來自芯片行業戰略合作伙伴沐曦集成電路(上海)有限公司(以下簡稱:沐曦)一項緊急的服務請求:EDA算力擴容。
在接到任務后,UCloud優刻得迅速成立專項小組遠程協同,發揮技術及資源優勢,全力支持沐曦在本輪疫情下的GPU芯片研發工作。僅一周時間內,就幫助沐曦完成了“金翼物理機+裸金屬”的算力擴容組合方案,滿足了芯片在測試期對于算力峰值的需求。這場疫情下的算力與時間競速,最終在UCloud專業的IT團隊支持下順利告捷。
沐曦于2020年9月成立,致力于為異構計算提供安全可靠的高性能GPU芯片及解決方案,產品具備“高性能”、“高能效”及“高通用性”的優勢,可廣泛應用于人工智能、智慧城市、數據中心、云計算、自動駕駛、科學計算、數字孿生、元宇宙等前沿領域,為數字經濟發展提供強大的算力支撐。
伴隨數字化時代到來,5G商業化進程推進,包括人工智能、自動駕駛、智能機器人等產業的快速發展,使得芯片被廣泛應用,同時也催生了對不同類型的芯片設計需求。芯片從設計到測試驗證、成品投產,要經歷一系列精密且復雜的流程工序,這其中EDA工具不可或缺。
EDA(電子設計自動化)是用來進行芯片設計的軟件,也被稱做“芯片之母”,它將直接決定芯片的功耗、面積、時延等各項性能指標。沐曦的工程師們正是依靠這樣的EDA平臺完成相關的芯片設計工作。
出于芯片行業的特殊性以及對性能、安全性的考量,過去,沐曦采購了上百臺物理服務器來支撐芯片研發設計等系列工作。但傳統的IT部署模式存在諸多弊端:當遇到周期性的算力峰值時,就會需要再次加大IT資源投入,這也意味著更高的成本支出;同時新資源的預估是難以精準確定的,依然會出現算力資源緊缺或浪費,因此,芯片企業不得不在資源規劃與投入成本之間持續尋求平衡。
在疫情期間,上海的本土企業被迫開啟居家辦公模式,而此時,沐曦公司的芯片設計正在進至關重要的“測試”階段。據了解,芯片投產前的測試驗證階段,會產生大規模的算力集群調度需求,達到物理上限。為了不影響芯片的設計進程,沐曦需要在短時間內完成“EDA算力擴容”。
金翼定制化物理機
在硬件設施層面,經過提前規劃,UCloud在一周時間內為沐曦部署上架了上百臺金翼物理機,保障了沐曦芯片設計驗證階段的算力峰值需求,化解燃眉之急。和傳統的物理機相比,UCloud金翼物理機靈活可定制,沐曦可以根據不同的算力應用場景,自由搭配服務器配置,快速獲得物理機資源。金翼物理機支持“按月租賃”的方式,幫助沐曦節約了30%以上的一次性資源投入成本。
受疫情下的物流限制,無法進入機房,UCloud還推薦沐曦使用裸金屬服務器,以強強組合的擴容方式支持芯片驗證的算力需求。UCloud裸金屬服務器類似云上的專屬物理服務器,兼具物理機的優異性能和虛擬機的靈活彈性,搭載RSSD高性能云盤,可快速部署、分鐘級交付。本次沐曦使用的裸金屬服務器在1天內就完成了部署。
在數據安全層面,UCloud金翼物理機具備物理級別隔離的優勢,真正做到資源0爭搶,數據安全有保障。配合UCloud完善的數據安全防護方案,加密數據安全傳輸通道,全面保護企業內網安全,防止企業核心資產數據泄露。
值得一提的是,在本次合作中,經過完備的EDA算力擴容方案,使得沐曦的芯片驗證效率大幅提升;相比常規的資源采購上架流程而言,整體部署周期至少提升1個月。當前,UCloud也正與沐曦溝通未來的合作方向,希望將云計算、大數據等技術力量融入芯片設計的全生命周期,在EDA算力擴容、數據安全防護、多地協同辦公等多場景下應用創新。*圖片由UCloud優刻得&沐曦提供授權