【ITBEAR】9月25日消息,2024年9月,各大廠商紛紛選擇在這個月份舉辦發布會,競相展示其最新的技術成果。其中,多模態技術以及與OpenAI的Sora視頻生成模型相媲美的產品成為了發布的主要內容。
云棲大會于9月19日拉開帷幕,阿里云在此發布會上推出了通義萬相AI視頻生成模型。緊接著,9月24日,字節跳動的首個視頻生成模型“豆包·視頻生成模型”在火山引擎AI創新巡展上驚艷亮相。
在眾多互聯網大廠中,百度是最早布局通用大模型的公司之一。然而,對于類似Sora的視頻生成模型,百度的態度卻顯得相對保守。截至目前,百度尚未發布獨立的視頻生成模型,其2024年1月提出的視頻生成方法UniVG仍停留在論文階段。
不過,在9月25日舉辦的百度云智大會上,百度突然發布了一項新的文生視頻功能。這一功能并非基于獨立模型,而是直接在升級到4.0版本的曦靈數字人平臺上實現,能夠生成3D數字人及3D視頻內容。用戶只需輸入文字指令,即可生成數字人,并可根據需求調整妝容和形象風格。這一AI生成功能的嵌入和迭代,使得3D數字人的生成時間從數小時縮短至5分鐘。
同時,3D數字人的成本也大幅降低,單價從萬元降至199元。百度云智大會的發布重點明顯偏向于實際應用,與2023年發布11款AI應用時的情況有所不同。2024年,百度云的命題已經轉變為向下游企業提供基礎設施和服務。
在基礎設施層面,支撐千億、萬億參數大模型的技術已經從CPU轉向以GPU為主,集群規模也從千卡擴大到了萬卡級別。百度集團執行副總裁、百度智能云事業群總裁沈抖認為,大模型的Scaling Law將在一段時間內持續有效,并預測很快會有更多的十萬卡集群出現。
為此,百度推出了最新的百舸AI異構計算平臺4.0,該平臺針對十萬卡集群的算力管理進行了優化。一方面,百舸4.0能夠將萬卡任務的有效訓練時長穩定在99.5%以上;另一方面,它將萬卡集群下的萬億參數MoE模型的算力利用率提升了30%。
在模型層面,百度持續致力于降低價格和使用門檻。截至目前,文心旗艦模型的降價幅度已經達到了90%,而ERNIE Speed和ERNIE Lite兩款主力模型則直接免費開放。據沈抖介紹,目前文心大模型的日均調用量已經超過了7億次,千帆平臺已經開發了超過70多萬個企業級應用。
在應用層面,百度云將自己定位為B端企業用戶的“賣水人”。除了數字人生成功能外,針對智能客服和代碼編程場景,百度云分別迭代了智能客服平臺“客悅”和代碼助手“文心快碼”。更新版的“客悅”已經支持語音、視頻等多模態交互方式,將智能客服處理復雜任務的能力提升至92%,超過了行業的平均水平(80%)。
代碼處理是AI模型最成熟的應用場景之一。多名從業者判斷,AI對代碼的理解和處理能力優于長文本?!捌髽I級代碼架構解釋”和“企業級代碼審查”是“文心快碼”新增的兩個功能。前者可幫助用戶理解原有代碼并快速上手開發;后者則能基于對項目的理解對代碼進行勘誤。
百度云在明確提供基礎設施的角色同時,對于下游應用層而言,百度CEO李彥宏在會上再次強調了他對智能體的看好:“就像互聯網時代的賬號一樣,智能體的門檻很低但上限卻很高?!?/p>
#百度# #AI大模型# #視頻生成# #智能體# #云智大會#