對(duì)于虛擬人,很多人并不陌生。早前科大訊飛的多語(yǔ)種虛擬主播小晴、央視A.I.虛擬記者通通,給了大眾對(duì)技術(shù)應(yīng)用的更多想象空間。
近日,科大訊飛虛擬人技術(shù)再突破,發(fā)布更加活潑生動(dòng)的A.I.虛擬人愛(ài)加,并最新上線了愛(ài)加幫你送新春祝福的H5《你用A.I.拜年了嗎?》,用戶可通過(guò)愛(ài)加,把最暖心的新春祝福送到家人朋友眼前。(在微信公眾號(hào)“科大訊飛”后臺(tái)回復(fù)“愛(ài)加”即刻體驗(yàn),還有機(jī)會(huì)獲得千元驚喜A.I.禮物)
和以往小晴等虛擬人不一樣的是,愛(ài)加在聲音、肢體動(dòng)作乃至于微表情的表達(dá)上更豐富,還熟悉更多種語(yǔ)言和方言,用戶通過(guò)愛(ài)加拜年,能讓天南海北的朋友倍感親切。
技術(shù)難點(diǎn)逐一擊破,這次愛(ài)加更“人性化”
人工智能不斷進(jìn)步,A.I.早已不再是冷冰冰的科技,而是演變成為能幫助人類享受智慧生活、守護(hù)情感世界的好幫手。虛擬人的應(yīng)用前景可期,但由于技術(shù)限制,其肢體動(dòng)作、語(yǔ)言、情感表達(dá)效果還不能滿足人們期待。
那么科大訊飛是如何攻克合成難點(diǎn),讓其A.I.虛擬人有更高的觸達(dá)率?
首先,拓展A.I.虛擬人的“本事”,讓其“能說(shuō)會(huì)道”“能歌善舞”。在科大訊飛A.I.虛擬人已有的多語(yǔ)種、多方言合成能力之外,科大訊飛提出了基于歌唱音準(zhǔn)的無(wú)監(jiān)督歌唱標(biāo)注方法,將發(fā)音和音準(zhǔn)分離,利用神經(jīng)網(wǎng)絡(luò)分層級(jí)預(yù)測(cè),結(jié)合高精度神經(jīng)網(wǎng)絡(luò)聲碼器合成高品質(zhì)歌曲,同時(shí)提出姿態(tài)自適應(yīng)的表情合成技術(shù),解決了舞動(dòng)狀態(tài)面部姿態(tài)大角度以及多角度快速切換場(chǎng)景下的唇形合成難題,在使得虛擬人在精通各種語(yǔ)言的同時(shí),還能傾情演唱。
其次,增強(qiáng)虛擬人的“人性化”。為了給虛擬人注入情感,使其在互動(dòng)表達(dá)中更有人情味,科大訊飛結(jié)合認(rèn)知心理學(xué)理論對(duì)虛擬人進(jìn)行交互情感設(shè)計(jì),利用無(wú)監(jiān)督表征學(xué)習(xí)方法,分離并獲取語(yǔ)音中的情感表征。同時(shí),利用海量文本無(wú)監(jiān)督語(yǔ)義模型對(duì)各類文本進(jìn)行情感分類預(yù)測(cè),實(shí)現(xiàn)人性化的端到端情感合成系統(tǒng),讓虛擬人“活潑”起來(lái)。
最后,提升虛擬人的“表現(xiàn)力”。為使拜年視頻更具個(gè)性化,科大訊飛提出結(jié)合場(chǎng)景的背景音樂(lè)、音效疊加方案。通過(guò)對(duì)常用場(chǎng)景分類分析,構(gòu)建豐富多元的背景音樂(lè)、音效資源庫(kù),結(jié)合具體應(yīng)用場(chǎng)景,進(jìn)行背景音樂(lè)、音效的預(yù)測(cè)、疊加,從而實(shí)現(xiàn)高表現(xiàn)力的虛擬形象合成,用戶能定制理想狀態(tài)中的拜年場(chǎng)景,讓A.I.拜年場(chǎng)景更加生動(dòng)多元。
值得一提的是,基于科大訊飛提出的海量說(shuō)話人的音視頻數(shù)據(jù)預(yù)訓(xùn)練技術(shù),虛擬人愛(ài)加能夠做到基于少量數(shù)據(jù)就完成快速的建模,滿足多種場(chǎng)景多種風(fēng)格形象的快速定制,同時(shí),當(dāng)前虛擬人實(shí)時(shí)合成的速度以及并發(fā)一直是業(yè)界的痛點(diǎn),科大訊飛本次的虛擬人拜年活動(dòng)支持了高并發(fā)在線高質(zhì)量視頻生成,從而大幅提升虛擬人視頻制作的效率。用戶只需要等待幾秒鐘就可以完成一個(gè)A.I.虛擬人合成視頻,有效突破了A.I.虛擬人因?yàn)椴l(fā)路數(shù)有限而不能大規(guī)模推廣的難題,同時(shí)也展現(xiàn)出A.I.虛擬人從toB向toC推廣應(yīng)用的可能。
可以預(yù)見(jiàn),虛擬人愛(ài)加只是一個(gè)科大訊飛在虛擬人技術(shù)突破的一個(gè)新起點(diǎn),它的出現(xiàn)為下一步A.I.虛擬人的大范圍、規(guī)模化應(yīng)用奠定了堅(jiān)實(shí)基礎(chǔ)。
目前,科大訊飛基于A.I.交互能力的虛擬形象解決方案,已經(jīng)應(yīng)用于多個(gè)場(chǎng)景,如虛擬站務(wù)員、虛擬金融理財(cái)顧問(wèn)、虛擬面試官,科大訊飛虛擬人的多模態(tài)得到了廣泛應(yīng)用。虛擬人愛(ài)加的技術(shù)突破,正是科大訊飛多年技術(shù)的厚積薄發(fā),用A.I.理念改變生活的發(fā)展理念的具體呈現(xiàn)。未來(lái),科大訊飛還會(huì)為虛擬人帶來(lái)怎樣的科技高峰再現(xiàn),值得期待。