【ITBEAR】9月24日消息,字節跳動旗下火山引擎今日在深圳成功舉辦AI創新巡展,活動中正式推出了兩款全新的大模型:豆包視頻生成-PixelDance與豆包視頻生成-Seaweed。
火山引擎總裁譚待在活動現場發表講話,強調視頻生成領域仍面臨諸多挑戰,并承諾豆包的兩款新模型將持續進化,致力于在解決核心問題上探索更多可能性,并加速AI視頻創作的應用落地與拓展。
據ITBEAR了解,豆包視頻生成模型在鏡頭切換方面展現出卓越能力,能夠實現自然流暢的多拍動作與復雜的多主體交互。基于DiT架構,該模型支持變焦、環繞、平搖、縮放、目標跟隨等多種鏡頭語言,同時在鏡頭切換時保持主體、風格、氛圍的一致性。
在畫面風格上,經過剪映、即夢AI等技術的持續迭代,豆包視頻生成模型已具備專業級的光影布局和色彩調和能力。其Transformer結構經過深度優化,可支持3D動畫、2D動畫、國畫、黑白、厚涂等多種風格,并能適配不同電子設備的屏幕比例,適用于電商營銷、動畫教育、城市文旅、微劇本等多種場景。
目前,新款豆包視頻生成模型正在即夢AI內測版中進行小范圍測試,預計未來將逐步開放給所有用戶。
此次活動還見證了豆包大模型家族的其他重要成員發布,包括豆包音樂模型和同聲傳譯模型,至此,豆包大模型已全面覆蓋語言、語音、圖像、視頻等多種模態。
火山引擎披露的數據顯示,截至9月,豆包語言模型的日均tokens使用量已超過1.3萬億,與5月首次發布時相比增長了十倍。同時,多模態數據處理量也分別達到每天5000萬張圖片和85萬小時語音。
關鍵詞:#字節跳動# #火山引擎# #豆包視頻生成模型# #AI創新# #多模態數據處理#