你能想象郭德綱用流利的英語說相聲,而美國女歌手泰勒·斯威夫特則操著一口標(biāo)準(zhǔn)普通話暢談自己專輯創(chuàng)作的幕后故事嗎?十月底,一大批沒有翻譯腔的“配音”視頻在網(wǎng)上走紅了,這不是哪個網(wǎng)友在玩明星配音,而是深度模擬AI的作品。
這一類視頻中出現(xiàn)的名人不少,除了泰勒·斯威夫特,英國女演員艾瑪·沃森、美國企業(yè)家馬斯克、電影角色鋼鐵俠等人物通通都說上了一口流利的普通話,而中國的名人們也沒躲過惡搞,除了郭德綱、于謙、岳云鵬這些相聲演員,網(wǎng)絡(luò)紅人羅翔、完顏慧德、馬保國也能說多國語言,不僅是英語,韓語、法語通通不在話下。
這些視頻還忽悠到了不少網(wǎng)友,在一條郭德綱的英語配音采訪視頻中,一名網(wǎng)友留言表示“啊?郭德綱老師英語原來這么好的?”也有識破了這是AI生成視頻的網(wǎng)友發(fā)出了感嘆,“郭德綱來了都得愣住。”會讓網(wǎng)友感到如此迷惑的原因在于視頻中的外語不僅是流利通暢、語句停頓自然,口型也完全一致,甚至聲線都難辨真假,和原視頻相對比,AI還模仿出了人物說話時原本的停頓和重音。
制作這些視頻的是一款名為heygen的AI視頻軟件,這是一款付費(fèi)軟件,價格還不低,使用起來很簡單,創(chuàng)作者只需要上傳視頻并選擇要翻譯的語言,軟件可以自動翻譯、調(diào)整音色并匹配嘴型。不過,也有使用過這款軟件的用戶表示,heygen并不算很完美,聲音克隆的效果仔細(xì)聽的話還是會有點(diǎn)違和感,人物在說話時情感度稍有欠缺,此外,不少觀看過用heygen生成外國人說中文的網(wǎng)友表示,生成的中文語音似乎有點(diǎn)南方口音,不是標(biāo)準(zhǔn)的普通話。
heygen這款軟件其實(shí)是個來自深圳的產(chǎn)品,背后的母公司為詩云科技,成立于2020年,“詩云”這個名稱取自劉慈欣的科幻小說《詩云》。Heygen前身是一個AI視頻翻譯平臺,對口型視頻翻譯功能最早上線于今年九月初,并于十月底在國內(nèi)的社交平臺走紅,heygen很快推出了付費(fèi)版并實(shí)現(xiàn)盈利,詩云科技聯(lián)合創(chuàng)始人兼CEO徐卓曾向媒體透露,heygen產(chǎn)品在七個月內(nèi)實(shí)現(xiàn)了100萬美元的年度經(jīng)常性收入,并保持9個月50%的月環(huán)比增長率。
在網(wǎng)友們拿著heygen玩梗名人的時候,對于這一軟件的擔(dān)憂之聲也出現(xiàn)了,heygen產(chǎn)出的視頻屬于深度合成,而且迷惑性相當(dāng)高,雖說是將一種語言翻譯成另一種語言進(jìn)行配音,但也有用戶利用其在聲音克隆方面的便捷,使用了自定義的文本進(jìn)行配音,并通過軟件生成對應(yīng)的口型,若被濫用,其誤導(dǎo)性之強(qiáng)不容小覷。記者就在某平臺上刷到了一個AI泰勒,她用普通話向中國的歌迷們問好,還和大家閑聊中國的美食,看起來似乎是很自然的歌手和粉絲互動的視頻被AI轉(zhuǎn)換成了中文,但仔細(xì)深究,人物口型替換了,背景也被替換了,發(fā)布者也沒有給出視頻來源,觀眾根本無從得知這段視頻里的泰勒原本到底是在說什么、做什么,視頻上是粉絲互動,但真實(shí)的視頻也可能和粉絲互動全然沒有關(guān)系。一些采訪類的視頻就更令人迷惑了,網(wǎng)友自制的某名人接受采訪的視頻被轉(zhuǎn)換成英文后,因?yàn)闆]有拍攝到記者的樣子,視頻片段中也沒有出現(xiàn)媒體的標(biāo)識,沒注意到這是AI生成的網(wǎng)友誤以為該明星近期接受了外媒采訪,登上了國際舞臺。從這一層面來說,類似heyen這樣的深度虛擬的AI視頻軟件如果想要在國內(nèi)市場被廣泛使用推廣,監(jiān)管將會是極為重要的一環(huán)。
揚(yáng)子晚報/紫牛新聞記者 沈昭