近日,北京百度網(wǎng)訊科技有限公司的“虛擬對(duì)象驅(qū)動(dòng)方法、深度學(xué)習(xí)網(wǎng)絡(luò)的訓(xùn)練方法及裝置”專利獲授權(quán)(申請(qǐng)公布號(hào):CN115345968A)。
根據(jù)專利摘要顯示的信息,則以專利涉及人工智能相關(guān)的深度學(xué)習(xí)、計(jì)算機(jī)視覺(jué)、虛擬 / 增強(qiáng)現(xiàn)實(shí)和圖像處理技術(shù)領(lǐng)域,可應(yīng)用于虛擬數(shù)字人、元宇宙等場(chǎng)景。
具體實(shí)現(xiàn)方案包括:響應(yīng)于獲取的語(yǔ)音數(shù)據(jù),確定初始語(yǔ)音特征;對(duì)初始語(yǔ)音特征進(jìn)行時(shí)序增強(qiáng)處理,得到目標(biāo)語(yǔ)音特征;基于目標(biāo)語(yǔ)音特征和目標(biāo)虛擬對(duì)象的基準(zhǔn)面部圖像,生成唇形圖像序列;根據(jù)唇形圖像序列,對(duì)目標(biāo)虛擬對(duì)象進(jìn)行驅(qū)動(dòng),使目標(biāo)虛擬對(duì)象執(zhí)行與語(yǔ)音數(shù)據(jù)匹配的唇部動(dòng)作。
簡(jiǎn)單來(lái)說(shuō),依靠該專利,基于人工智能深度學(xué)習(xí),虛擬數(shù)字人在發(fā)聲時(shí),嘴唇部分的肌肉動(dòng)作能夠更為貼近真人,從而實(shí)現(xiàn)整體擬真度的提升。
在后續(xù),基于這一技術(shù),以及百度公布的類ChatGPT項(xiàng)目文心一言(ERNIE Bot),百度有望推出高度擬真,且可以與用戶自然對(duì)話的虛擬形象。
【來(lái)源:快科技】