【ITBEAR】9月30日消息,近期,“三只羊集團創始人盧文慶錄音事件”鬧得沸沸揚揚,令人意想不到的是,受害者竟是AI。合肥警方通報稱,廣為流傳的音頻實為AI生成,犯罪嫌疑人已被依法采取刑事強制措施。這一通報不僅給出了官方態度,也讓之前聲稱“AI聲音克隆技術還做不到那么絲滑”的所謂“國內AI第一人”顏面掃地。
然而,戲劇性的一幕出現了,一家AI公司跳出來聲稱這條音頻是通過他們研發的AI配音大模型制作的,此舉被網友戲稱為“自殺式營銷”。為了驗證這家公司的說法,我們在隱去相關公司和產品名稱的基礎上進行了實測,發現AI克隆聲音的技術確實已經相當成熟,只需幾秒的聲音樣本就能讓名人“開口說話”。
實測過程中,我們通過操作幾個簡單步驟,僅花了一分鐘就讓姜文“念出”了《讓子彈飛》中六子的臺詞,效果逼真到讓人難以分辨。我們還上傳了一段馬斯克的采訪錄音,讓AI馬斯克“親口”說出了中式英語,效果同樣驚人。這顯示出AI在音頻生成方面的技術已經相當成熟。
實際上,AI聲音克隆只是AI音頻生成的一個細分賽道。早在生成式AI出現之前,AI聲音克隆就已經存在,但當時的技術門檻較高。如今,在AIGC浪潮下,AI工具只需10秒甚至更少的聲音樣本就能精準復刻音色。這也讓“三只羊錄音門”出自AI之手變得技術上可行。
然而,AI聲音克隆技術的快速發展也帶來了法律層面的挑戰。今年4月,北京互聯網法院審理了全國首例“AI聲音侵權案”,判決被告未經原告許可使用其聲音構成侵權。這顯示出在AI技術的快速迭代下,普通人、一線從業人員以及法律之間存在一定的信息差。
除了司法實踐中的侵權案例外,內容平臺上的AI聲音侵權更為廣泛和隱秘。層出不窮的AI工具降低了創作門檻,AIGC已成為熱門的內容生產方式。用AI聲音克隆技術進行二創在國內外內容平臺上已十分常見。然而,這也帶來了版權、倫理、數據隱私等多方面的問題亟待進一步討論。