“為你彈奏肖邦的夜曲,紀(jì)念我死去的愛(ài)情……”熟悉的旋律,這次卻換了不一樣的“人”來(lái)唱。8月18日,龔俊數(shù)字人形象首次亮相由百度和央視新聞聯(lián)合舉辦的“百度世界2021”大會(huì),演唱一首經(jīng)典曲目《夜曲》,一顰一笑都和本人十分相似。
如果在微博上搜索“龔俊”的相關(guān)詞語(yǔ),可以看到龔俊數(shù)字人唱歌被其粉絲廣泛關(guān)注。
除了龔俊數(shù)字人,全球首個(gè)火星車(chē)數(shù)字人祝融號(hào)也亮相大會(huì),與主持人和嘉賓流暢互動(dòng),答題作詩(shī)。這些能力皆來(lái)自于百度智能云。
揭秘?cái)?shù)字人背后的百度智能云技術(shù)
簡(jiǎn)單地說(shuō),龔俊數(shù)字人、火星車(chē)數(shù)字人背后擁有高精度寫(xiě)實(shí)、模型輕量靈活、驅(qū)動(dòng)方式豐富多樣三大技術(shù)優(yōu)勢(shì)。
棱角分明的臉型,流暢的動(dòng)作表演,數(shù)字人如龔俊真人一樣“帥氣”。百度智能云采用4D掃描技術(shù),收集大量高精度訓(xùn)練數(shù)據(jù),讓機(jī)器學(xué)習(xí)進(jìn)行人像驅(qū)動(dòng)綁定和反復(fù)迭代調(diào)優(yōu),使得數(shù)字人表情更逼真,肢體動(dòng)作流暢自如,并基于高精擬真3D人像制作綁定技術(shù),讓人物面部材質(zhì)接近真實(shí)皮膚質(zhì)感,還可根據(jù)相機(jī)的距離進(jìn)行自動(dòng)優(yōu)化調(diào)節(jié)。
整場(chǎng)《夜曲》聽(tīng)下來(lái),龔俊數(shù)字人的聲音和口型基本沒(méi)有偏差,百度輕量級(jí)AI模型讓逐字口型準(zhǔn)確率高達(dá)98.5%以上。采用輕量級(jí)的深度神經(jīng)網(wǎng)絡(luò)模型,實(shí)現(xiàn)端到端的表情實(shí)時(shí)控制,精準(zhǔn)口型同步,并支持?jǐn)?shù)十種預(yù)置微笑、美顏動(dòng)作和預(yù)置身體動(dòng)作,讓虛擬人越來(lái)越真實(shí),同時(shí)模型還具有渲染性能優(yōu)異、連線延遲、互動(dòng)效果良好三大優(yōu)勢(shì)。
另一方面,百度智能云數(shù)字人技術(shù)支持文本、語(yǔ)音等多種驅(qū)動(dòng)方式,多國(guó)語(yǔ)言喚醒。文本驅(qū)動(dòng)支持中英文輸入,可插入表情、動(dòng)作等,文本可轉(zhuǎn)合語(yǔ)音驅(qū)動(dòng),語(yǔ)音驅(qū)動(dòng)支持真人和合成聲音輸入,漢語(yǔ)、英語(yǔ)、德語(yǔ)、俄語(yǔ)等多語(yǔ)種均可,除此之外,數(shù)字人還支持普通RGB攝像頭面部驅(qū)動(dòng)、深度攝像頭面部采集驅(qū)動(dòng)共四種驅(qū)動(dòng)方式。
降低創(chuàng)造門(mén)檻,推動(dòng)數(shù)字人普及
當(dāng)前,虛擬數(shù)字人在客服、傳播、營(yíng)銷、社交等領(lǐng)域的價(jià)值正在得到廣泛認(rèn)可。越來(lái)越多的金融、游戲、媒體、文娛、電商等企業(yè)開(kāi)始推出虛擬數(shù)字人助手,通過(guò)打造個(gè)性化、定制化的服務(wù),為客戶創(chuàng)造更好的價(jià)值。
但是,整個(gè)數(shù)字人行業(yè)仍有三大痛點(diǎn)亟需解決,一是產(chǎn)業(yè)鏈效率較低,由于整個(gè)行業(yè)還處于相對(duì)早期的階段,上下游各個(gè)生態(tài)沒(méi)有被完全打通;二是缺乏標(biāo)準(zhǔn),目前行業(yè)還沒(méi)有建立起數(shù)字人的標(biāo)準(zhǔn)化體系;三是缺乏平臺(tái),只有通過(guò)平臺(tái)化的產(chǎn)品聚沙成塔,不斷分?jǐn)偝杀尽⒐δ芨幽K化,才能夠幫助客戶降低數(shù)字人制作和運(yùn)營(yíng)成本。
基于此,百度智能云推出數(shù)字明星運(yùn)營(yíng)平臺(tái),一方面通過(guò)平臺(tái)化的方式讓越來(lái)越多的數(shù)字人進(jìn)入平臺(tái)來(lái)均攤前期的投入成本;另一方面基于平臺(tái)打造完整的生態(tài)鏈服務(wù)。
百度智能云還推出“燦星計(jì)劃”,從技術(shù)、生態(tài)、流量三方面扶持國(guó)內(nèi)虛擬人IP,改善IP生存生態(tài)及因觸媒習(xí)慣造成的宣發(fā)渠道閉塞,通過(guò)“平臺(tái)賦能+冷啟動(dòng)服務(wù)“的方式賦能IP所有者,幫助更多人了解并使用數(shù)字人,惠普行業(yè)。
未來(lái),百度數(shù)字虛擬人技術(shù)將積累更多數(shù)據(jù)創(chuàng)造更好的模型,優(yōu)化基礎(chǔ)技術(shù),改善服飾和人物形象,增強(qiáng)個(gè)性化素材,根據(jù)不同行業(yè)需求定制不同形象、功能、性格的數(shù)字人,推動(dòng)數(shù)字人產(chǎn)業(yè)不斷地向前演進(jìn)。
我們?cè)?jīng)在科幻電影中看到的那些智能助手,也許有一天就會(huì)出現(xiàn)在你我身邊。