【ITBEAR】9月30日消息,近期,“三只羊集團(tuán)創(chuàng)始人盧文慶錄音事件”鬧得沸沸揚(yáng)揚(yáng),令人意想不到的是,受害者竟是AI。合肥警方通報(bào)稱,廣為流傳的音頻實(shí)為AI生成,犯罪嫌疑人已被依法采取刑事強(qiáng)制措施。這一通報(bào)不僅給出了官方態(tài)度,也讓之前聲稱“AI聲音克隆技術(shù)還做不到那么絲滑”的所謂“國(guó)內(nèi)AI第一人”顏面掃地。
然而,戲劇性的一幕出現(xiàn)了,一家AI公司跳出來聲稱這條音頻是通過他們研發(fā)的AI配音大模型制作的,此舉被網(wǎng)友戲稱為“自殺式營(yíng)銷”。為了驗(yàn)證這家公司的說法,我們?cè)陔[去相關(guān)公司和產(chǎn)品名稱的基礎(chǔ)上進(jìn)行了實(shí)測(cè),發(fā)現(xiàn)AI克隆聲音的技術(shù)確實(shí)已經(jīng)相當(dāng)成熟,只需幾秒的聲音樣本就能讓名人“開口說話”。
實(shí)測(cè)過程中,我們通過操作幾個(gè)簡(jiǎn)單步驟,僅花了一分鐘就讓姜文“念出”了《讓子彈飛》中六子的臺(tái)詞,效果逼真到讓人難以分辨。我們還上傳了一段馬斯克的采訪錄音,讓AI馬斯克“親口”說出了中式英語,效果同樣驚人。這顯示出AI在音頻生成方面的技術(shù)已經(jīng)相當(dāng)成熟。
實(shí)際上,AI聲音克隆只是AI音頻生成的一個(gè)細(xì)分賽道。早在生成式AI出現(xiàn)之前,AI聲音克隆就已經(jīng)存在,但當(dāng)時(shí)的技術(shù)門檻較高。如今,在AIGC浪潮下,AI工具只需10秒甚至更少的聲音樣本就能精準(zhǔn)復(fù)刻音色。這也讓“三只羊錄音門”出自AI之手變得技術(shù)上可行。
然而,AI聲音克隆技術(shù)的快速發(fā)展也帶來了法律層面的挑戰(zhàn)。今年4月,北京互聯(lián)網(wǎng)法院審理了全國(guó)首例“AI聲音侵權(quán)案”,判決被告未經(jīng)原告許可使用其聲音構(gòu)成侵權(quán)。這顯示出在AI技術(shù)的快速迭代下,普通人、一線從業(yè)人員以及法律之間存在一定的信息差。
除了司法實(shí)踐中的侵權(quán)案例外,內(nèi)容平臺(tái)上的AI聲音侵權(quán)更為廣泛和隱秘。層出不窮的AI工具降低了創(chuàng)作門檻,AIGC已成為熱門的內(nèi)容生產(chǎn)方式。用AI聲音克隆技術(shù)進(jìn)行二創(chuàng)在國(guó)內(nèi)外內(nèi)容平臺(tái)上已十分常見。然而,這也帶來了版權(quán)、倫理、數(shù)據(jù)隱私等多方面的問題亟待進(jìn)一步討論。