【ITBEAR】9月12日消息,在AI生成視頻工具賽道日益擁擠的今天,生數科技憑借其新品Vidu脫穎而出,該產品專注于解決視頻生成中的一致性問題,引發了行業內的廣泛關注。
Vidu通過其新上線的主體參照功能,實現了在視頻生成過程中鎖定參考圖片主體形象的能力,用戶只需通過描述詞即可切換場景,同時保持主體形象的一致性,這一創新功能顯著提升了視頻生成的連貫性和可控性。
據ITBEAR了解,生數科技CEO唐家渝在近日的媒體開放日上宣布了這一功能,并表示這是解決當前視頻模型存在的不可控局限性的關鍵步驟。他提到,盡管目前市場上已有不少AI生成視頻產品,但在連續性、輸出結果穩定性等方面仍有待提升。
唐家渝進一步解釋,Vidu背后的技術架構融合了Diffusion與Transformer,這是全球最早由生數科技團隊提出的視覺生成模型融合架構。他強調,盡管技術路線已逐漸收斂,但不同產品間的實際能力仍因算法細節和工程化實現而異。
在談及視頻生成時長時,唐家渝透露,目前Vidu模型已支持最長32秒的視頻生成,但尚未正式上線。他表示,拓展生成時長需要模型具備更強的世界抽象理解能力,而這正是生數科技未來技術突破的重點之一。
商業化方面,生數科技采取了SaaS訂閱和API兩種模式并行的策略。唐家渝透露,目前公司已收到數萬個API接入申請,且B端市場收入占比較大,但C端增長勢頭同樣強勁。他預計,隨著技術的不斷成熟和應用場景的拓展,AI生成視頻將逐漸走向大眾化。
展望未來,唐家渝對生數科技在AI生成視頻領域的發展充滿信心。他表示,公司將持續致力于降低創作者門檻,加速創作過程,并探索更多模態的生成與理解統一模型。隨著技術的不斷進步,他相信AI生成視頻將在不久的將來迎來更加廣泛的應用。
#生數科技# #Vidu# #AI生成視頻# #一致性生成# #多模態統一模型#