2023 年,數字人直播徹底火了。根據艾媒咨詢的統計,2022 年一年虛擬主播(數字人)企業注冊增加數就高達 948 家,增速達 68 %。
數字人即虛擬數字人,指存在于非物理世界中,由計算機圖形學、圖形渲染、動作捕捉、深度學習、語音合成等計算機手段創造及使用,并具有多重人類特征(外貌特征、人類表演能力、人類交互能力等)的綜合產物,也被稱為虛擬形象、虛擬人等。
數字人
數字人分類
(1) 從驅動方式劃分虛擬數字人的分類,可以分為真人驅動型和智能驅動型。
真人驅動型虛擬數字人:這種類型的虛擬數字人主要基于真實人物,通過視頻監控系統捕捉用戶的視頻,實時與用戶進行語音互動,并借助動作捕捉采集系統將真人的表情和動作呈現在虛擬數字人形象上,從而實現與用戶的互動。
智能驅動型虛擬數字人:這種類型的虛擬數字人通過智能系統自動讀取和解析外部輸入信息,根據解析結果做出決策,生成數字人后續的輸出文本,然后通過驅動人物模型產生相應的語音和動作,與用戶進行互動。這些人物模型是通過AI技術預先訓練而得,能夠通過文本生成語音和對應的動畫。隨著人工成本逐漸攀升以及人工智能技術的不斷進步,智能驅動型虛擬數字人有望成為未來的行業發展趨勢。
(2) 從商業化和應用場景來區分,虛擬數字人可分為內容/IP型、功能服務型和虛擬分身型。
內容/IP型虛擬數字人:主要應用于影視、文娛和市場營銷等領域。功能服務型虛擬數字人則更多地應用于行業服務場景,如電商、金融、教育、醫療、文旅等。這兩種類型的虛擬數字人主要面向B端市場。
虛擬分身型虛擬數字人:除了服務于B端市場外,這種類型的虛擬數字人還滿足C端用戶的需求,用于虛擬空間中的形象分身和代理,例如在虛擬社交平臺中的應用。
數字人怎么制作?
傳統的虛擬人的實現主要由形象設計、建模、驅動、渲染4大環節組成。其中形象設計、建模、驅動、渲染環節主要依靠影視CG、VFX技術與游戲引擎等實現。
建模環節通過3D建模技術,將虛擬人形象進行細節精細還原。驅動環節則依賴于動作捕捉技術,將真實人類的動作遷移到虛擬人上,包括形體、表情、眼神和手勢等方面的關鍵點變化。而渲染技術則通過實時渲染技術,提升虛擬人的逼真程度。
然而,隨著技術的不斷進步,制作虛擬數字人的過程變得更加便捷和高效。
現在,想要制作一個數字人分身,只需要提供一段3-5分鐘的真人出鏡口播視頻,就可以提交克隆的需求。一般情況下,完成整個數字人的制作只需要3-5天的時間。這得益于精準控制數字人的嘴唇和肢體動作等關鍵要素,使得數字人的擬真度可以達到極高水平,甚至接近99%,其外表與真人基本無異。
數字人行業相關公司
騰訊智影
“騰訊智影”是一款集成了AI創作能力的智能創作工具,提供虛擬數字人、文本配音、文章轉視頻、模板創作、在線視頻剪輯等功能,“智影數字人”是其中的核心功能,可提供數字人播報解決方案等相關解決方案。
小冰公司(前身是微軟小冰團隊)
小冰提供“人工智能數字員工”解決方案,在內容生成方面,依托小冰框架的人工智能創造能力(AIGC),數字員工可以快速學習業務數據,獲取相應技能,穩定輸出文本、圖片、音頻、視頻等內容;而在交互能力方面,數字員工具備情感對話和多模態交互的特點,可進行人聲定制,同時支持多語種和多方言交流。
硅基智能
硅基智能數字人匯集了多項領先技術,包括人物形象模擬、智能語音交互、NLP(自然語言處理)、無穿戴表情動作捕捉以及openGPT大語言模型等,將這些技術有機融合,從而迅速構建出外貌與真人接近,智力也接近真人水平的AI數字人。
借助人物形象模擬技術,硅基智能數字人能夠模仿各種外貌特征,從肢體動作到面部表情,細致地還原真人的各種細微動作。
風平智能
風平智能借助先進的AIGC、NLP(自然語言處理)、AI驅動等技術,能夠生成五官比例和人臉特征細節都逼真還原的超仿真數字人,同時接入類Chat GPT以及上百種語音模型,進一步讓數字人擁有媲美人類的語言能力。
風平智能傾向于做好技術和產品,尤其注重數字人+大模型的AI數字人解決方案,已經涵蓋了銀行保險、基金證券、醫療、新東方、萬達等一系列的大客戶。也是目前唯一一個可以支持本地高達20G的高清視頻作為背景的,這對有高質量要求的大企業幫助很大,可以做各種大屏幕的演示展覽。
在數字人領域,許多公司都在不斷探索創新。例如,騰訊智影提供了集成了AI創作能力的智能創作工具,小冰公司則專注于“人工智能數字員工”的解決方案,硅基智能則匯集了多項領先技術,風平智能則專注于數字人與大模型的綜合解決方案。這些公司的努力和創新,正推動著數字人直播行業不斷向前發展,為未來帶來了更多可能性。