【ITBEAR】近年來,隨著AI技術的迅猛發展,AI視頻已逐漸滲透到我們的日常生活中,從短視頻平臺的小貓視頻合成,到西游記中的AI妖精形象,再到動畫片中的合成畫面,AI視頻無處不在。據統計,中國AI視頻生成的潛在市場空間預計超過5800億元,這無疑是一個巨大的市場。
然而,隨著市場的火熱,一系列問題也逐漸浮現。成本高昂、質量參差不齊、協同困難和性能挑戰等問題,讓眾多初創企業和大廠頭疼不已。以GPT-4為例,其開發成本高達1億美元,訓練成本也接近8000萬美元。而視頻模型的訓練和推理成本更是高得驚人,如新推出的視頻模型Sora,其算力需求遠超GPT-4。
面對這些挑戰,一些企業已經開始尋求解決方案。抖音和火山引擎便是其中的佼佼者。火山引擎近期推出的PixelDance效果驚人,其背后的功臣是一個名為BMF的智能框架。這個框架通過預處理海量視頻數據,并在短時間內生產高質量的視頻素材用于模型訓練,從而大大提高了效率和質量。
BMF框架相當于一個“年夜飯一鍵全流程套餐”,它提供了一系列的工具和服務,幫助企業輕松、快捷地準備好“年夜飯”。這個套餐重點針對性地解決了行業痛點,如視頻訓練數據質量問題、性能難題等。
除了BMF框架,火山引擎還推出了BMF-Lite版本,更適合普通用戶使用。這個版本實現了更輕量、更高效、更通用的進化,統一了各個平臺的接口形式,方便集成部署。同時,火山引擎還自研了視頻轉碼芯片,將自研的視頻編解碼技術融入其中,大大提高了轉碼能力。
在視頻編解碼層,火山引擎推出了基于自研視頻轉碼芯片構建的“BVE1.2編碼器”。這個編碼器融合了深度學習技術,推出了革命性的智能混合編解碼解決方案,極大地提升了編解碼的效率。在第六屆深度學習圖像壓縮挑戰賽(CLIC大賽)中,“BVE1.2編碼器”榮獲兩個冠軍,實力不容小覷。
火山引擎的這些技術突破無疑為AI視頻行業的發展提供了新的思路。通過開源BMF框架和BMF-Lite版本,火山引擎正在推動整個行業的進步和發展。這種競爭與合作共存的態度,無疑是中國AI行業最樂意見到的場面。