【ITBEAR】9月24日消息,字節跳動近日正式宣布進軍AI視頻生成領域,推出了兩款面向企業市場的大模型——“豆包視頻生成-PixelDance”與“豆包視頻生成-Seaweed”,并開啟了邀測活動。
這兩款“豆包視頻生成”大模型憑借其出色的語義理解能力、對復雜交互畫面的精準捕捉以及多鏡頭切換下的內容一致性,成功躋身業界領先水平。它們不僅能夠深度理解并響應復雜的指令,驅動不同人物角色完成一系列精細的動作互動,還在細節處理上達到了極致,從人物樣貌、服裝的微妙變化到頭飾的精準呈現,均能在不同運鏡角度下保持高度一致,呈現出如同實拍般的自然流暢效果。
據ITBEAR了解,“豆包視頻生成”模型依托字節跳動自主研發的DiT(Dynamic Integration Transformer)架構,通過高效的DiT融合計算單元,實現了視頻在大動態場景與多樣運鏡之間的無縫切換。這一技術突破為視頻創作帶來了更多的自由度和靈動性,滿足了創作者對視覺表達的無限想象。同時,該模型還采用了全新設計的擴散模型訓練方法,有效攻克了多鏡頭切換過程中保持主體、風格、氛圍一致性的技術難題,確保在鏡頭切換的瞬間,視頻的整體氛圍與細節表現依然和諧統一,為觀眾帶來更加沉浸式的觀看體驗。
為了進一步提升視頻創作的專業性和觀賞性,“豆包視頻生成”團隊在技術創新上不斷突破。他們通過優化算法和增強模型的學習能力,使得生成的視頻在畫質、流暢度以及細節處理上都達到了業界頂尖水平。這一系列的努力不僅提升了視頻的質量,也為創作者提供了更多發揮創意的空間。
目前,“豆包視頻生成”系列模型已在即夢AI內測版中開啟小范圍測試,旨在收集用戶反饋,不斷優化產品性能。這一舉措不僅展示了字節跳動在AI視頻生成領域的雄心壯志,也為未來的視頻創作市場帶來了新的期待和可能性。
關鍵詞:#字節跳動# #AI視頻生成# #豆包視頻生成# #DiT架構# #沉浸式觀看體驗#