【ITBEAR科技資訊】9月23日消息,華為在今日的全聯接大會2023期間發布了一項重大突破,正式推出了Atlas 900 SuperCluster,這是一款全新架構的昇騰AI計算集群,專門設計用于支持超大規模模型訓練,參數容量高達萬億級別。
華為企業BG總裁兼ICT基礎設施業務管理委員會主任汪濤在發布會上介紹了這一創新產品,他表示,Atlas 900 SuperCluster采用了最新一代的華為星河AI智算交換機CloudEngine XH16800,該交換機具備高密度的800GE端口能力,使得只需要兩層交換網絡即可構建一個擁有2250個節點的超大規模集群,相當于18000張計算卡的規模。
更為引人注目的是,這款集群采用了全新的超節點架構,極大提升了大模型訓練的性能。汪濤強調,大算力已經成為推動人工智能發展的核心引擎。為了滿足日益增長的計算需求,華為進行了系統架構創新,將算力、運力、存力融為一體,成功突破了大算力瓶頸。
據ITBEAR科技資訊了解,為了進一步加速大模型創新,華為還發布了CANN7.0,這是一個更加開放、易于使用的平臺。它不僅與業界主流的AI框架、加速庫和大模型兼容,還深度開放底層能力,使得AI框架和加速庫可以更加靈活地調用和管理計算資源,為開發者提供了更多的自定義高性能算子的可能性。
華為在計算、網絡、存儲、能源等領域的綜合優勢,使得這一新集群在器件級、節點級、集群級和業務級全面提升了系統的可靠性,將大模型訓練的穩定性從天級提升到了月級水平。這個突破性的產品將為人工智能領域的發展提供更強大的支持,推動大模型時代的到來。