谷歌發(fā)布 “Vlogger” 視頻模型框架：單張圖片生成 10 秒視頻-魔扣目錄

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

谷歌發(fā)布 “Vlogger” 視頻模型框架：單張圖片生成 10 秒視頻

發(fā)布時間：2024-03-20 14:43:00 作者：網友整理

劃重點:
?? 谷歌發(fā)布新視頻框架 “Vlogger”，可以通過單張圖片和錄音生成本人演講視頻。
?? Vlogger 模型基于擴散模型，包含音頻到人體動作和文本到圖像模型。
?? Vlogger 具備多樣性和自然性，可應用于視頻編輯和翻譯等領域。

（ChinaZ.com）3月20日消息:谷歌最近發(fā)布了一項名為 “Vlogger” 的新視頻框架，可以通過僅一張圖片和錄音即可生成一個本人演講視頻。

這一框架基于擴散模型，包含音頻到人體動作和文本到圖像模型兩部分。其中，音頻波形被用來生成人物的身體控制動作，包括眼神、表情、手勢等，使生成的視頻看起來自然且生動。該模型訓練在一個包含80萬個人物視頻的大型數據集上完成。

Vlogger 的突出之處在于其多樣性和完整性。與其他方法相比，Vlogger 不需要對每個人進行訓練，也不依賴于面部檢測和裁剪，生成的視頻包括面部、唇部和肢體動作等。此外，Vlogger 還具有視頻編輯和翻譯等應用，能夠讓人物閉嘴、閉眼，甚至進行視頻翻譯。

雖然谷歌尚未發(fā)布具體模型，但通過展示效果和論文，可以看到 Vlogger 在視頻生成領域的潛力和優(yōu)勢。然而，一些網友對其生成視頻的畫質、口型對不上等問題提出了質疑和吐槽。盡管如此，Vlogger 的發(fā)布仍引起了業(yè)界的廣泛關注和討論。

谷歌發(fā)布的 Vlogger 模型為視頻生成領域帶來了新的可能性，具備多樣性和自然性，為視頻編輯和翻譯等應用提供了新的解決方案。隨著技術的不斷進步和完善，相信 Vlogger 將在未來有更廣泛的應用和發(fā)展。

產品入口:https://top.aibase.com/tool/vlogger

分享到：

標簽：Vlogger 視頻生成 AI頭條

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

文章分類

熱門網站

數獨一種數學游戲，玩家需要根據9

您可以通過答題星輕松地創(chuàng)建試卷

各種考試題，題庫，初中，高中，大學四六

記錄運動步數，積累氧氣值。還可偷

每日養(yǎng)生,天天健康

通用課目體育訓練成績評定