1月13日,百度AI官方視頻號發布了一條特殊的視頻——《百度研究院2021年十大科技趨勢預測》,該視頻完全由AI自動剪輯生成,制作者只需一鍵輸入新聞鏈接即可生成視頻。其中,起到關鍵支撐的是百度大腦圖文轉視頻技術(VidPress)。
此前,該技術也已應用于人民日報對外推出的“人民日報創作大腦”產品。該產品旨在為內容生產全面賦能,運用人工智能等技術為媒體機構和內容創作者提供通用型創作工具,提升內容生產和分發效率,助力媒體深度融合。當前,在人工智能、5G、云計算、大數據等技術驅動帶來更豐富的多媒體內容、傳播視頻化成為媒體內容進化的行業大趨勢下,媒體行業也在加快智能升級的步伐。
基于百度強大的人工智能技術,“人民日報創作大腦”推出新聞轉視頻、直播剪輯、智能寫作、新聞追蹤數據、媒體訂閱數據、智能配音等在內的18項智能生產工具,覆蓋媒體策、采、編、發的全流程。而得到大家廣泛關注的新聞轉視頻工具就是基于百度大腦圖文轉視頻技術(VidPress)打造,我們一起來深入了解下這項強大的技術。
圖文轉視頻(VidPress)是在2020年初由百度研究院孵化推出,是業界首個支撐通用型、大規模的全自動視頻生產技術。它的價值在于利用算法和AI模型自動進行故事線生成,降低素材搜集、整理、匹配、剪輯的時間成本,實現全自動智能化新聞視頻內容生產。用戶可零門檻快速上手,通過圖文鏈接一鍵導入,自動實現配音、字幕、畫面的視頻內容生產,極大提升了視頻制作全流程的效率,滿足從小白新手到專業視頻創作者的視頻制作需求。
貫穿視頻生產全流程,四大核心優勢提供一站式服務
圖文轉視頻(VidPress)擁有功能操作簡單、完整視頻生產服務、可預置視頻素材庫和靈活搭建應用平臺四大核心優勢,可快速實現短視頻內容生產:
操作方面實現0基礎上手,普通用戶、媒體創作者通過上傳Word稿件、新聞網址,即可在幾分鐘內完成短視頻內容生產。
提供完整的視頻生產服務,可自動完成素材的聚合、匹配與解說詞生成,提供10+種不同風格的男女聲AI語音播報,并完成字幕的自動合成,還支持自定義上傳角標、片頭和片尾。
在素材豐富度上,圖文轉視頻(VidPress)可以預置視頻素材庫,能夠支持多種類型的媒體素材導入方式,滿足視頻素材庫深度定制需求,幫助用戶迅速建立自有媒體素材庫。
提供全套API技術能力,用戶可以根據自己的需求,自由搭建視頻生產應用平臺,大幅降低視頻生產研發門檻,提升視頻創作的效率。
領先技術帶來“智”能流暢體驗,大幅提升制作分發效率
圖文轉視頻(VidPress)詮釋的視頻生產方式,足以用“智能”一詞來形容,媒體創作者可以從通稿式“標準”內容,一鍵轉化為快訊、短視頻等多樣化形態,分發至不同平臺、不同受眾,目前圖文轉視頻(VidPress)生產一條視頻僅需要幾分鐘,用低成本創作高品質的媒體內容,大幅提升媒體工作者的創作效率。
為實現上述能力,圖文轉視頻(VidPress)實現了一套完整的基于解說摘要生成、語音合成、視覺素材提取與理解、音視頻對齊的短視頻自動生成的技術框架。可低成本、高時效、大批量、高質量地制作短視頻。
在核心技術方面,圖文轉視頻(VidPress)具有行業領先的視頻場景解說摘要生成、視覺素材提取、視覺內容理解、音視頻內容自動對齊等技術,目前已獲得面向視頻場景的解說摘要生成、主圖視覺素材搜索等多項創新技術和AI算法專利,利用核心技術提升機器視頻制作效率和質量。
圖文轉視頻(VidPress)已在百度百家號、百度好看視頻大規模投放使用,生成一個時長2分鐘的視頻,制作時間僅需要5分鐘,整個過程從熱點新聞發現到最終的視頻生成,實現無人化、自動化,顯著提升人工剪輯短視頻的生產效率。
積極探索媒體創新與應用,AI帶來無限拓展可能
截止目前,百度大腦圖文轉視頻(VidPress)已累積生產近50萬條視頻,成為被廣泛應用的工具,并助力“人民日報創作大腦”全新發布。接下來,百度大腦圖文轉視頻(VidPress)將會繼續深入優化自動化視頻生成算法,提升視頻生成質量和效率,并將提供面向體育、知識等不同領域和垂類的短視頻生產服務。
未來,多模態圖文轉換將會面對更多自動化生產需求,以適應新聞、電商、各垂類自媒體等需要時效性、低成本推廣的訴求。通過從上游連接文本生成、資訊熱點發現,下游連接自動化發布、審核、推廣等環節,打通自動化視頻內容生產系統的任督二脈,大幅降低視頻生產環節對人力的依賴。
百度大腦圖文轉視頻(VidPress)在“人民日報創作大腦”產品中率先落地,標志著百度正將先進的人工智能技術賦能媒體生產。未來,以百度大腦圖文轉視頻(VidPress)為代表的AI技術將更深刻的變革媒體及更多行業的作業模式,加速推進媒體產業的智能化進程和全國新聞媒體的深度融合發展。