4月16-17日,2021LiveVideoStackCon音視頻技術大會在上海舉行,作為多媒體技術領域的盛會,大會聚焦音頻、視頻、圖像等技術的最新探索與應用實踐,探討的話題覆蓋教育、社交、游戲、智能設備等多個產(chǎn)業(yè),邀請了千余知名技術開發(fā)者參會。小影科技受邀出席大會,公司研發(fā)總監(jiān)發(fā)表了題為《視頻內(nèi)容生產(chǎn)工具中的多媒體技術——小影科技的實踐》的演講。
隨著 5G、云計算、人工智能的高速發(fā)展,以短視頻為載體的信息傳遞方式越來越普及,移動端視頻創(chuàng)作軟件逐漸成為剛需應用。在此背景下,小影科技作為國內(nèi)領先的視頻創(chuàng)作軟件開發(fā)者,不斷以新技術、新產(chǎn)品推動移動視頻領域的智能化進程。
小影科技的多媒體技術體系,包含跨平臺音視頻編輯引擎技術、實時圖形渲染與圖像特效技術、智能算法驅(qū)動的計算機視覺技術等在內(nèi)的核心技術,該體系在支持多款視頻創(chuàng)作軟件落地的同時,也在全球近10億人次使用基礎上的不斷迭代,從實踐中突破了圖像及音視頻領域算法的發(fā)展瓶頸。
其中,小影科技自主研發(fā)的計算機視覺技術,在人臉人體素材理解、分割系列算法、玩法與效果系列算法等領域有諸多突破。技術團隊不斷優(yōu)化智能圖像裁切、智能視頻裁切、視頻人像生成類特效處理框架等維度的算法技術,以提高用戶剪輯視頻的效率和質(zhì)量。
公司技術團隊不斷創(chuàng)新,去年iPhone12上市時自帶LiDAR技術,能夠拍攝帶有深度信息的畫面,捕捉人物或場景的三維位置及尺寸。為了讓用戶在視頻創(chuàng)作軟件中更好地體驗該功能, 小影科技技術團隊深度研究了Depth圖像后處理的算法,同步解決了視頻圖像閃爍等問題。
而在特效開發(fā)層面,團隊充分利用基于深度學習的圖像分割技術研發(fā)了“發(fā)絲流動”特效,讓小影科技旗下多款視頻創(chuàng)作軟件一度成為爆款,在海外多個國家和地區(qū)大受歡迎。
小影科技多媒體技術體系的迭代,離不開多個層面的要素。音視頻編輯引擎技術團隊基于前瞻性思考和布局,為研發(fā)的擴展部署打好堅實基礎;圖形渲染與圖像特效技術則與設計師等外部創(chuàng)意團隊共同協(xié)作,不斷演進和創(chuàng)新。近九年的研發(fā)歷程,都圍繞著讓任何一個零剪輯經(jīng)驗的普通用戶,能夠輕松便捷地完成高質(zhì)量短視頻制作,且能夠一鍵分享到不同的多媒體平臺這個目標。
未來,小影科技多媒體技術體系將向著更廣泛的應用領域深入,無論是開發(fā)更智能的視頻創(chuàng)作軟件,或是觸達上下游產(chǎn)業(yè)鏈,賦能文娛、新聞媒體、教育等多個產(chǎn)業(yè)與視頻化形態(tài)相融合,都有著極其廣闊的發(fā)展空間。