【ITBEAR】9月28日消息,中國電信人工智能研究院近日取得了重大突破,成功完成了國內首個完全基于國產化萬卡集群訓練的萬億參數大模型,并將千億參數的星辰語義大模型TeleChat2-115B對外開源。
這一里程碑式的成果顯示,國產大模型訓練已全面實現國產化替代,邁入了自主創新、安全可控的新階段。TeleChat2-115B大模型依托于天翼云的“息壤一體化智算服務平臺”及“星海AI平臺”進行訓練,不僅保證了訓練精度,還通過多項優化技術顯著提升了訓練效率和穩定性。
在模型訓練過程中,TeleAI團隊創新性地采用了小模型Scaling策略,有效驗證了不同模型結構的性能。同時,通過精細的數據配比和回歸預測模型,實現了訓練數據的優化配置。
后訓練階段,TeleAI合成了大量針對數學、代碼和邏輯推理的問答數據,用于監督式微調。團隊還采用迭代式更新和拒絕采樣技術,進一步提升了模型生成的答案質量和數據代表性。
為便于業界同仁共同研究與進步,TeleChat2-115B大模型已在多個平臺開源,包括GitHub、Gitee、ModelScope和Modelers,供全球開發者和研究者免費訪問和使用。