2024年8月19日,北京人工智能生態大會在中關村國家自主創新示范區會議中心頤和廳成功召開。智譜CEO張鵬作專題分享,簡要介紹了昇騰對自主創新的智譜大模型的助力,以及正在打造的基于昇騰的第四代代碼模型CodeGeeX4和多模態模型CogVLM2-video,華為昇騰計算業務副總裁劉鑫介紹昇騰原生進展。
智譜代碼生成大模型CodeGeeX4的新版本基于昇騰AI與昇思AI框架訓練,依托昇騰與昇思的多維混合分布式并行技術等軟硬件能力等,將大幅提升模型開發、訓練的效率及模型精度。
智譜CEO 張鵬
華為昇騰計算業務副總裁 劉鑫
模型能力
1.代碼生成大模型CodeGeeX4
第四代代碼模型CodeGeeX4堪稱代碼生成大模型的“六邊形戰士”,已經發布的CodeGeeX4-ALL-9B 僅用百億級參數實現模型精度超越業界主流產品。在NaturalCodebench等測試基準上,相對于更大的模型實現了性能反超。
CodeGeeX4單一模型實現編程開發全流程覆蓋,包括需求設計、前端開發、后端開發、數據處理等場景,支持代碼補全和生成、代碼問答、代碼解釋器、工具調用、聯網搜索、項目級代碼問答等全面能力。模型長序列達128K,支持中文、英文、俄語、法語、西班牙語等20+自然語言和300+編程語言。同時,在模型推理可實現單卡部署,最低24GB顯存即可進行量化推理,用戶可在本地私有化部署,保護企業代碼安全。
2.多模態大模型CogVLM2-video(視頻生成文本)
多模態大模型CogVLM2-video實現視頻生成文本能力,支持2K序列長度、224×224分辨率的視頻理解以及中英文回答等功能。測試實踐顯示,CogVLM2-video在多個視頻問答任務上達到了state-of-the-art SOTA模型)的性能,并能夠實現一分鐘內的視頻理解,在幾個主流性能測試數據集(MVBench, VideoChatGPT-Bench and Zero-shot VideoQA datasets)中,CogVLM2-video也表現不俗,展現出全面競爭力,同時在多類主要指標上完成對其他模型的領先。
基于昇騰與昇思的新版本CodeGeeX4
CodeGeeX4在訓練過程中,調用昇騰原生的融合算子,利用昇思MindSpore AI框架的提供的多維混合分布式并行能力,通過對流水交織并行、tensor模型并行的優化,解決內存瓶頸、降低計算空泡、提升通信效率,實現“計算、網絡、存儲”協同優化,對比同等規模參數的模型,訓練效率20%提升,加速模型的迭代創新。
該模型也采用MindSpore 2.3版本原創的多級編譯技術,開啟O1編譯選項增加自動算子融合優化,以接近動態圖的啟動時間獲取了圖模式下接近理論值的內存復用率,進而降低重計算比例,相對動態圖獲得15%的性能收益。
未來,智譜將與昇騰AI持續攜手,打造更多領先的自主創新大模型,加速人工智能產業發展,助力中國千行百業的智能化轉型,共同邁向智能新世界。