【ITBEAR】9月25日消息,2024百度云智大會在北京盛大召開,標志著大模型及其配套技術正迅速崛起為新一代基礎設施的核心。
百度智能云事業群總裁沈抖在大會上強調,大模型及其配套的算力管理平臺、模型和應用開發平臺正在加速成為行業的新基石。他指出,2024年大模型的產業應用正在以前所未有的速度推進,文心大模型在千帆大模型平臺上的日均調用量已超過7億次,累計幫助用戶精調了3萬個大模型,并開發出70多萬個企業級應用。尤為引人注目的是,過去一年中,文心旗艦大模型的降價幅度超過90%,主力模型更是全面免費,極大地降低了企業創新和試錯的成本。
據ITBEAR了解,為了滿足企業對于大模型落地的全方位需求,百度智能云發布了百舸AI異構計算平臺4.0。這一升級版平臺面向萬卡、十萬卡集群全面升級了算力管理能力,致力于解決超大規模GPU集群的高成本與難運營兩大挑戰。
在集群創建階段,百舸4.0預置了主流的大模型訓練工具,實現了工具層面的秒級部署,將萬卡集群的運行準備時間從幾周縮減至1小時,顯著提升了部署效率。開發實驗階段,百舸4.0升級后的可觀測大盤能夠對多芯適配、集群效能、任務自動容錯等方面進行全方位監測,為用戶提供直觀決策依據。
百度智能云事業群總裁沈抖在大會上介紹新技術
在模型訓練階段,百舸4.0通過一系列創新,實現了接近無損的集群容錯,有效訓練時長占比在萬卡集群上達到99.5%以上,業界領先。同時,通過集群設計、任務調度、并行策略、顯存優化等技術,百舸4.0大幅提升了集群的模型訓練效率,整體性能相比業界平均水平提升高達30%。
面向未來,沈抖預測,大模型的Scaling Law將在一段時間內持續有效,并預計很快會有更多的十萬卡集群出現。然而,管理十萬卡集群的難度遠超萬卡集群,對物理空間、能耗以及網絡通信都提出了巨大挑戰。針對這些難題,百舸4.0已經構建了十萬卡級別的超大規模無擁塞HPN高性能網絡、10ms級別超高精度網絡監控,以及面向十萬卡集群的分鐘級故障恢復能力。
會上,生數科技聯合創始人兼CEO唐家渝宣布,其公司開發的國內首款全面對標OpenAI Sora的視頻大模型“Vidu”將通過百度智能云千帆大模型平臺面向開發者、企業用戶開放API服務。同時,對于自建智算中心的客戶,百舸4.0對“一云多芯”能力進行了升級,多芯混合訓練效能高達95%,保持業界領先。
此外,百度智能云還發布了千帆大模型平臺3.0,全面升級了模型調用、模型開發、應用開發三大服務。升級后的千帆平臺不僅支持調用包括文心系列大模型在內的近百個國內外大模型,還支持調用各種傳統的小模型,并持續降低模型調用成本。在模型開發方面,千帆3.0提供了最完善的大模型工具鏈,并支持一站式的大、小模型開發服務。
沈抖還在現場演示了如何通過對話,在AI速搭平臺上開發一個資產管理應用,只需一句話描述需求,大模型就能清晰理解并生成應用,極大地縮短了開發時間。
此次大會還展示了百度智能云在多個行業的成功應用案例,包括三星電子、獵聘、考試寶等,這些企業通過利用百度智能云的技術和平臺,實現了業務效率的大幅提升和創新能力的增強。
關鍵詞:#百度智能云# #大模型# #算力管理# #千帆平臺# #產業應用#