2023中國國際大數據產業博覽會今天上午在貴陽市開幕。本屆數博會以“數實相融 算啟未來”為年度主題開展峰會、展覽、大賽等活動。5月25日,由上海張江集團、貴州貴安發展集團聯合承辦的人工智能大模型高端對話在貴陽國際生態會議中心舉辦,貴陽市市長馬寧宇出席會議并致辭,中國工程院院士、清華大學計算機系教授鄭緯民等專家在會上作主旨演講。優刻得公司受邀參會,與其他來自芯片、服務器、數據中心、行業協會等領域的嘉賓,圍繞“數實相融,創新智算”主題開展圓桌對話,共同探討數據、算力與AI大模型的技術和產業趨勢。
大模型引領了AI落地和應用的新篇章,云計算為大模型的快速發展提供所需的智算基礎設施支撐。UCloud優刻得副總裁劉杰認為,國內大模型的發展存在算力、數據、算法和工程四個方面的挑戰。
在算力層面,訓練大模型需要龐大的計算集群和高性能的硬件設備。隨著模型規模的增加,所需的算力也會相應增加。目前國內大模型因為禁售等原因面臨高端算力芯片供給不足,同時國產算力芯片形成規模化應用能力還需要一定時間。
在數據層面,大模型需要大規模的數據集進行訓練,數據的多樣性和廣覆蓋,對于模型的性能至關重要。目前,國內基于中文語義的大模型訓練所需要的中文數據總量不夠,且質量不高,同時數據流通還面臨信息安全等問題。
在算法層面,大模型的訓練涉及上千億參數,需要高效的算法來加速和優化模型性能。千億模型的混合精度訓練性能不穩定且調試困難,而傳統的機器學習算法和模型結構,難以有效地擴展到大模型訓練。
在工程層面,大模型訓練需要數千張甚至上萬張卡同時進行計算,涉及到基礎設施的性能、網絡架構的設計等,以確保高性能、可擴展性和可靠性,工程化的實踐非常難。
當前,UCloud正通過全棧云計算技術能力和工程實踐能力,為AI大模型提供安全可靠的智算基礎設施服務。
在算力方面,基于“東數西算”兩大自建數據中心——內蒙古烏蘭察布數據中心和上海青浦數據中心,UCloud為大模型訓練和應用提供低成本、高附加值的算力服務。UCloud自建數據中心內部署了GPU高性能計算產品,上線了NVIDIA的V100S等多款顯卡,,A800也即將上線,滿足大模型用戶在多場景下的GPU加速需求。值得一提的是,位于西部的烏蘭察布數據中心電力價格相對較低,可為大模型訓練降低30%-50%的運營成本。
面對大模型落地的私有化場景,UCloud還推出了全棧私有云解決方案,基于 UCloudStack 私有云、UCloudStor 分布式存儲及 USDP 智能大數據平臺等,構建安全穩定的私有化大模型基礎設施。
在數據方面,為降低數據存儲成本,UCloud在數據中心內部署了新一代歸檔存儲產品US3,相較標準存儲降低80%存儲成本,為大模型訓練需要的海量語料數據存儲和備份,提供更具性價比的解決方案。在數據流通環節,UCloud數據安全流通平臺安全屋,將數據所有權和使用權分離,采用可信數據沙箱、安全多方計算、聯邦學習等多種技術,保障數據可用不可見,可用不可拿,促進數據要素的流通,讓更多專業性、稀有性、獨特性數據釋放價值。
在工程方面,作為一家創業型的云計算公司,UCloud擁有從數據中心、服務器、到計算、存儲網絡、安全、架構設計等全方面的資源積累和技術積累,可以為大模型行業快速構建穩定可靠的基礎設施。
隨著AI行業發展,MaaS模式將成為AI應用的全新形式且快速發展,重構AI產業的商業化結構生態,激發新的產業鏈分工和商業模式。當前,UCloud也在探索與達觀數據、云知聲等擁有數據和大模型的公司合作,以“大模型+大算力”的方式,為產業客戶提供MaaS服務,降低AI應用開發門檻,促進大模型在產業場景中的落地。
與會嘉賓還探討了“東數西算”與大模型訓練的關系。劉杰表示,大模型的“東數西訓”,正是國家“東數西算”戰略的一部分。大模型訓練和推理對算力需求是不一樣的,訓練用算力對訓練集群外部的延時不敏,完全可以放在西部地區的數據中心進行。
劉杰表示,包括貴安、烏蘭察布在內的西部數據中心,承載大模型訓練具有以下優勢:一是西部地區有可靠的數據中心環境,為大模型訓練提供一個穩定的基礎設施保障;二是訓練成本低,西部地區電力資源豐富,電價比較低;三是西部地區有大量的可再生能源、清潔能源,為大模型需要的算力提供綠色能源支持。