10月31日-11月1日,國內年度規模最大的音視頻技術領域峰會LiveVideoStackCon在北京隆重舉行。本屆大會以“多媒體開啟新世界”為主題,匯集了國內外音視頻技術領域100余位頂尖技術專家,吸引了全國近千名音視頻開發者參會,話題涵蓋教育、娛樂、社交、電商等十余個領域。摩象科技作為一家專注于視覺智能方向的技術廠商受邀參會,為廣大來賓分享了橙影智能攝影機從零到一進行研發的創新之旅。
由中國網絡視聽節目服務協會發布的《2020中國網絡視聽發展研究報告》顯示,中國短視頻用戶規模已經超過8億人,日均使用時長高達110分鐘,短視頻正在人們日常生活中,占據越來越高的比例。隨著短視頻行業的蓬勃發展,人們對于視頻拍攝設備的需求也在同步擴大。作為一家技術驅動的小米生態鏈公司,摩象科技花費近2年的時間研發了集拍攝剪輯于一體的橙影智能攝影機,旨在解決廣大消費者在日常視頻創作過程中所遇到的畫面抖動、跟蹤困難、器材沉重以及后期剪輯繁瑣等一系列問題。
作為一臺智能化的短視頻創作工具,橙影在技術上最大的創新點在于通過算法實現了對視頻中場景、人物、動物、物體等被拍攝目標的實時識別、分析和標簽化,自動從海量素材中篩選高光片段,并根據畫面內容智能匹配合適的模板、濾鏡及背景音樂,借助擁有2T高算力的海思3519A芯片,在短短10秒內即可生成一段高質量的vlog視頻。除此之外,116°超廣角鏡頭在云臺相機上的應用,以及對于以及人臉、人體、動物、特定圖像的識別和追蹤,也都是業界中令人眼前一亮的創新,橙影智能攝影機也因此被稱為“vlog神器”。大會現場,摩象科技軟件技術總監劉智美向來賓分享了橙影研發過程中,從芯片選型、軟件系統架構到鏡頭畸變校正、網絡模型訓練等遇到的一系列困難以及摩象技術團隊所采用的解決方案,并與多位參會者進行了坦誠和深入的交流。
未來,摩象技術團隊除了將通過提升像素、幀率等方式來來進一步提升橙影在視頻拍攝過程中的表現之外,還將進一步探索“AI+視頻”方向更多的可能性,如語義生成、物體跟蹤及AI繪圖等,以技術革新者的姿態創造和引領AI視覺領域更多的創新和變革。