AI大模型推動人機交互模式發生革命性變化,讓更高效、更逼真、更智能的數智人應用成為可能。在9月7日舉辦的2023騰訊全球數字生態大會上,騰訊云智能數智人產品公布三大升級,依托行業大模型技術,實現數智人生產效率及交互體驗提升,降低數字人應用門檻,加速推動AI數字人普惠。
其中,全新發布“通用口型版”小樣本數智人,只需要1分鐘真人口播視頻,平臺便可通過多模態數據輸入,無需訓練生成個性化口型,在1小時內制作出與真人近似的“數智人”。
騰訊云智能數智人創意展臺
大模型技術助力數智人生產提效 生產時長縮短至1小時
今年4月,騰訊云智能小樣本數智人生產平臺首次對外發布,平臺具有訓練樣本小、生產效率高、自動化生產等特性,可以輕松實現“自助式”數智人生產制作。依托行業大模型,騰訊云智能數智人工廠全新升級,覆蓋三大方向:生成效率更高、應用場景更廣、3D數智人生產運營更智能。
在生成效率上,全新發布的“通用口型”版小樣本數智人,生產時間、生產素材需求都進一步降低。在AI大模型技術的加持下,基于自監督機制的通用多模態模型,通過擴充人像特征提取及口型關系綁定,無需訓練即可生成每個人的個性化口型特征。這推動2D小樣本數字人生產時長可從24小時縮短至1小時,生產素材簡化至只需要1分鐘真人口播視頻。
在應用場景上,全新升級的“交互式”小樣本數智人,支持“傾聽等待狀態”識別,能夠根據真實對話場景進行手勢的停頓、變化。這將使得“交互式”小樣本數智人不再局限于短視頻生產等單向播報場景,也可以廣泛用于服務咨詢等交互場景。
在生產運營上,依托AI建模綁定算法,騰訊云智能實現照片式生成3D形象,改變手工作業形式,大幅提升3D形象生成速度,支持批量打造3D數智人;同時,全面升級“智能驅動”3D數智人,可以基于語義為3D數智人自動匹配動作,讓3D “數智員工”服務體驗接近于真人員工。例如,圍繞大模型客服,數智人可以依據大模型實時生成的答案,匹配相應的表情、動作,實現更自然的交互。
目前,騰訊云智能數智人被廣泛應用于口播視頻生產、直播帶貨等場景。以媒體領域為例,小樣本數智人等技術正在為媒體數字化轉型升級注入更多AI力量,包括南方日報、南方都市報等機構用數智人輔助采編團隊生成口播視頻,進一步提升內容生產效率。
發布數智人伙伴扶持計劃,覆蓋直播運營、營銷代理、MCN等領域
此前,騰訊云智能提出自動化“AI+數智人工廠”的方向,通過做厚aPaaS數智人平臺,致力于讓合作伙伴能夠應用開箱即用的數智人生產服務,快速完成大批量數智人形象、音色定制,開發出更多適用于垂直行業、垂直場景的數智人SaaS服務。目前,已經有數十家合作伙伴依托平臺,向行業提供數智人直播SaaS、知識口播SaaS應用,覆蓋醫療、傳媒、金融多個行業。
為了推動數智人服務更廣泛落地,以“普惠化”服務走入千行百業,騰訊發布了“數智人伙伴扶持計劃”,為直播運營、營銷代理、MCN等領域伙伴提供數字人技術支持。
首批騰訊云智能數智人授權合作伙伴包括北京風平智能科技有限公司、中數聯成(廣東)文化有限公司、深圳市單仁牛商科技有限公司,以及陜西醫智諾信息科技有限公司。
首批騰訊云智能數智人授權合作伙伴
騰訊云副總裁、騰訊云智能解決方案負責人王麒表示,參與“數智人扶持計劃”的企業,不僅能夠獲得騰訊云官方授權證書及官網展示,還會獲得市場拓展專項資金、標桿案例聯合發聲等系列支持。
目前,騰訊云智能數智人已經覆蓋3D寫實、3D半寫實、3D卡通、2D真人、2D卡通五種形象風格,可實現超細微面部情感表情以及數百種肢體動作,支持形象資產管理、業務服務配置及內容生產相關服務,以滿足不同場景下的服務需求。
在數智人之外,AI大模型的應用正逐步滲透到千行百業的各個環節,包括設計、研發、生產、營銷和服務等,一場由“大模型”驅動的“效能革命”正在悄然發生。基于此,騰訊云從產業客戶實際需求出發,基于自研的騰訊混元大模型,同時支持業內主流的開源模型應用,從技術底座、平臺能力和智能應用三個維度不斷升級MaaS能力,助力客戶構建專屬大模型和智能應用,推動大模型在產業中的落地應用。未來,騰訊云還將推出更多開箱即用的大模型產品、服務,推動大模型等AI技術在實際生產、運營場景發揮效用。