阿里巴巴推出AtomoVideo高保真圖生視頻框架，兼容多種文生圖模型-魔扣目錄

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > 科技前沿 >正文

阿里巴巴推出AtomoVideo高保真圖生視頻框架，兼容多種文生圖模型

發布時間：2024-03-07 12:50:00 作者：網友整理

3 月 7 日消息，阿里巴巴研究團隊近日推出了 AtomoVideo 高保真圖生視頻（I2V，Image to Video）框架，旨在從靜態圖像生成高質量的視頻內容，并與各種文生圖（T2I）模型兼容。

AtomoVideo 演示

IT之家總結 AtomoVideo 特性如下：

高保真度：生成的視頻與輸入圖像在細節與風格上保持高度一致性

運動一致性：視頻動作流暢，確保時間上的一致性，不會出現突兀的跳轉

視頻幀預測：通過迭代預測后續幀的方式，支持長視頻序列的生成

兼容性：與現有的多種文生圖（T2I）模型兼容

高語義可控性：能夠根據用戶的特定需求生成定制化的視頻內容

AtomoVideo 圖生視頻流程

AtomoVideo 使用預先訓練好的 T2I 模型為基礎，在每個空間卷積層和注意力層之后新添加一維時空卷積和注意力模塊，T2I 模型參數固定，只訓練添加的時空層。由于輸入的串聯圖像信息僅由 VAE 編碼，代表的是低層次信息，有助于增強視頻相對于輸入圖像的保真度。同時，團隊還以 Cross-Attention 的形式注入高級圖像語義，以實現更高的圖像語義可控性。

目前，該團隊只發布了 AtomoVideo 的論文及演示視頻，并未提供在線體驗地址。同時官方開設了 GitHub 賬戶，但僅用作官方網站托管，并未上傳任何相關代碼。

【來源：IT之家】

分享到：

標簽：視頻圖像語義保真度卷積生成模型可控性