剛剛過去的“五一”假期里,許久未露面的孫燕姿,現身長沙海潮宇宙音樂節。同時期,“AI孫燕姿”在各大短視頻平臺走紅。真人與AI在不同次元遙相呼應,孫燕姿戲劇性地成為了本與她關系不大的AI領域的主角。
《漠河舞廳》(原唱:柳爽)、《發如雪》(原唱:周杰倫)等歌曲經由“AI孫燕姿”演唱,網友的評價是“重新認識了這些歌曲”。
“AI孫燕姿”版《發如雪》的彈幕
目前,B站上AI孫燕姿翻唱的作品中,播放量高的都能達到百萬級,彈幕評論上千條。抖音上“AI孫燕姿”話題也有超1400萬播放量,按播放量排序,為首的一支視頻有近七千條評論。有聽眾評價,“AI孫燕姿”一開口,歌就變得“更高級了”。
聽眾評論“AI孫燕姿”
“AI孫燕姿”順勢成內容標簽、自媒體創作風口,不論是音樂垂直賬號,還是娛樂營銷號。或搬運或自制,都開始參與到“AI孫燕姿”之中,分享著流量紅利。
層出不窮的“AI孫燕姿”
《電商在線》通過對多名幕后創作者的采訪了解到,有人因喜愛孫燕姿而投身其中,“用愛發電”,也有人借此牟利,或賣課或“做號”——只是收獲不佳,相關技術教程月銷三單。
海潮宇宙音樂節現場,有粉絲就“AI孫燕姿”一事,詢問孫燕姿本人的看法,她僅笑著回應有聽說過,但并無明確評價。其經紀公司則澄清,目前沒有委托律師處理相關事宜。
作為現象級事件,“AI孫燕姿”的走紅,體現的是AIGC在語音領域的技術“涌現”——從ChatGPT到midjourney(最大的人工智能繪畫平臺),人工智能浸入對話、繪畫,以及如今的音樂。由此帶給行業與消費市場諸多新思考——AI孫燕姿是怎么被創造出來的,創作者的訴求是什么?這又是否會改造音樂領域的生產與消費邏輯?
孫燕姿粉絲,用愛發電
“AI孫燕姿”是如何創造出來的?從技術角度理解,這是基于“生成式語音模型”的一款AIGC內容產品(AI generated content,人工智能生成內容)。
創作者通過向模型“投喂”孫燕姿語音素材進行音色訓練,然后對希望演繹的流行歌曲進行模型推演、音色替換。更簡單地說,就是將一個人的聲音轉換成另一個人的,但保留原聲的旋律、節奏和情感,是一種“虛擬翻唱”。
嚴格意義上,這應當被視作一種“深度仿作”,而非所謂的AI版孫燕姿。業界也有共識,即AI版孫燕姿在聲音上不論如何接近本尊,歸根到底都只是一場民間模仿秀,與真人有著無法抹除的客觀距離。“AI孫燕姿”更完整的說法,也應該是“孫燕姿的AI模仿版”。
“我是孫燕姿的粉絲,在網上聽到相關的‘AI孫燕姿’的作品之后,也想聽偶像唱一些沒唱過的歌曲,就一頭扎了進去。”韓龍是一名理工科大學生,熱衷于在音樂領域進行“二次創作”。“過去兩年有嘗試玩一些‘鬼畜’,也積累了一點認知和技術,‘AI孫燕姿’和‘鬼畜’對我來說其實差不多,都是對音樂進行二次加工。”
“AI孫燕姿”的創作門檻并不高。目前最主流的制作工具是“UVR_v5.5.0”和“So-VITS-SVC4.0”,網上有大量公開的“整合包”,用戶不需要懂技術,不用自己手動編寫算法,直接拿前人搭建好的產品來用就行。
So-VITS-SVC4.0,整合包已設計得頗為“傻瓜式”
相對耗費時間和精力,也有些技術門檻的,是對音頻訓練素材的整理。“需要準備一些‘干聲’,也就是無音樂的純人聲,但孫燕姿的歌曲都有伴奏、間隙,所以得會一些基礎的音頻剪輯,比如提取人聲、把音頻剪切成更‘干凈’的小片段。”
這是為了最大限度提高語音訓練素材的質量,以得到最佳的訓練結果。“訓練完成后,導入想要替換聲音的歌曲,進行模型推演就行了。如果聲音不像,就需要加大‘投喂’的音頻規模、繼續訓練、調教參數,直到滿意為止。”
能夠完成上述操作的,其實已算得上“技術黨”。更“小白”的做法,是下載網上自帶聲音模型的整合包。用戶不需要再額外找素材、訓練,直接推演生成歌曲就行。
“有一點學習能力、探索精神,一臺配置還過得去的電腦,按部就班地跟著教程走,都可以創作出自己的‘AI孫燕姿’。”但韓龍也補充,想要有更好的、更個性化的效果,就得自己來訓練模型。
“需要配置N卡(NVIDIA英偉達系列顯卡)的電腦,跑一個模型(算法學習輸入的音頻素材)大概在30—60小時左右,具體做一首歌,耗時半個小時到兩個小時的樣子。”易仁也是孫燕姿的粉絲,他補充,如果使用帶訓練成型的模型的整合包,就能幫創作者省下至少30個小時的訓練時間。
“如果電腦配置不行,也可以租用一些云端算力。”如今,國內大大小小的云計算平臺都有針對AIGC需求推出云端分布式GPU,價格低的僅需幾毛錢一小時。“顯卡能力越強,訓練效率就越高,當然也越貴。”
部分顯卡租賃平臺的報價
粗略計算,訓練一個“AI孫燕姿”聲音模型,外租算力的成本,起步是一兩百元左右,仍算得上便宜。所以,一個有意思的問題是:門檻那么低、歌手那么多,為什么最紅的是“AI孫燕姿”?
“AI孫燕姿”初始創作者之一Rcell告訴記者,他和團隊經過半年時間做了上百組實驗,采集了孫燕姿的四張專輯《孫燕姿 同名專輯》《克卜勒》《逆光》《是時候》,共計約100首歌曲作為訓練數據。“嘗試過其他歌手的音色轉換,比如周杰倫、林俊杰、王菲等等,但是效果都不如孫燕姿好。孫燕姿的聲音清晰、穩定、有特點,而且歌曲風格多樣、難度高、情感豐富,所以特別適合做AI訓練。”
“孫燕姿被訓練得越多,AI的音色質量就越高,就越容易受到市場的追捧,先發優勢就像滾雪球一樣。”易仁強調,當下對歌手進行AI版復刻的熱潮中,“AI孫燕姿”的質量自居一檔。
一本萬利的生意,買家卻不多
韓龍的自媒體賬號,播放量最高的視頻是“AI孫燕姿”版《清明雨上》(原唱:許嵩),達26.7萬次。播放量第二高的手辦視頻僅1.8萬次播放,差距不小。“AI孫燕姿”能為他的賬號帶來不小的曝光,但他自述目前沒有任何商業、變現相關的需求。
“大部分參與‘AI孫燕姿’創作的人,都沒有明確的商業規劃。純粹就是玩,但存在一些可能的變現方向,也的確有人這么在做。那類人是投機商,和我們不一樣。”
比如售賣制作教程、打包好的訓練音頻。記者觀察到,某些博主會在“AI孫燕姿”內容下方的評論區進行文字引導,或是添加外部鏈接,推動觀眾購買教程、音頻素材,定價從十幾元到百來元不等。
“他們賣的東西,網上免費版比比皆是,而且不難找。”韓龍解釋,這些商家并不是賺“AI孫燕姿”的錢,而是賺AIGC在每一次走紅中,存在的信息差的錢。“有些用戶不擅長用搜索工具,也可能純粹就是懶。”
宣稱永久性一對一輔導,僅需93元
記者添加了一名出售訓練音頻和教程的商家,其朋友圈還有在售比如AIGC繪畫模型訓練素材,以及ChatGPT賬號注冊教程。
“不可持續、銷售規模也大不了。”商家坦言,做這門生意,對他來說是“瞎貓等待死耗子”,其實沒成交幾單,但勝在沒有成本,全是利潤。“一個月賣出兩單,賺了一百多塊錢,但我挺滿意的,反正是‘撿’的。”
《電商在線》之前講述過注冊200個賬號,賣5萬一套的系統,那些靠ChatGPT賺錢的人。回顧那些“中間商”的境況,不論是出于外部監管還是自身原因,目前的結局無一例外,都是“割完離場”。
也有人靠“AI孫燕姿”內容進行漲粉,然后打包賬號出售。在自媒體領域,這是頗為古典的營銷思路——什么火就做什么內容,不考慮長期運營,更關注短期的流量爆發與漲粉速度。
十幾條視頻,漲粉6000余名
記者觀察到,B站上有名為“陳墨瞳1995”的賬號,憑借十余條“AI孫燕姿”視頻,粉絲數漲至六千多。抖音上創作“AI孫燕姿”內容的十萬級粉絲賬號,其往期作品大多方向發散——AI歌手,到經典老歌,甚至搞笑視頻、互聯網技能教程,讓人找不準主心骨。
“短視頻平臺的算法里,對單個內容有獨立的推薦權重,即便賬號質量一般,但如果內容蹭上了平臺扶持的熱點,也能夠獲得不小的推薦。何況,很多內容可能都是偽原創,修修改改而已,成本也低”,有曾任國內某頭部短視頻平臺的廣告運營向記者介紹,做到幾萬或十幾萬粉絲,就可以轉交給中間商進行出售,“有些企業小老板追時髦做公司抖音號,就會想著買個有基礎粉絲的賬號過來,市場還是有的,反正也花不了幾個錢,幾千塊就能搞定。”
但他也坦言,這類號的基礎權重有限,流量全看后續發布的內容質量,其實是個“空架子”。
當然,更具技術與營銷實力的公司,其實早在“AI孫燕姿”走紅前,就已將此類模型、算法打包生成消費級APP,支持用戶自主輸入想要訓練的聲音,選擇想要替換的歌曲,然后一鍵生成質量穩定的翻唱版本。國內,“虛擬歌手”“ACE虛擬歌姬”“歌嘰歌嘰”等客戶端均有類似功能。
但賺錢之前,投身“AI孫燕姿”創作的商人們,或許更需要考慮“合規”問題。
監管與扶持,都是對行業的“鼓勵”
5月9日,抖音發布關于人工智能生成內容的平臺規范暨行業倡議。其中主要舉措,是發布者需對人工智能生成內容產生的相應后果負責。同時,發布者應對人工智能生成內容進行顯著標識,幫助其他用戶區分虛擬與現實,特別是易混淆場景。
同時期,小紅書平臺也已出現類似監管。被系統識別為AIGC后,內容上方就會出現相應的標識。
內容平臺當下主要的監管舉措
平臺主動作為,部分原因在于AIGC目前仍處在版權的“灰色地帶”,而近期走紅的“AI孫燕姿”因涉及明星、歌曲等強版權要素,爭議尤為廣泛。
此前在國外,一首合成了歌手Drake和Weekend音色的AIGC歌曲《Heart on My Sleeve》上線Youtube平臺。但隨后,歌手方唱片公司環球音樂要求平臺進行下架處理,并發問,“是要站在藝術家、粉絲和人類創造性表達的一邊,還是站在Deepfake、欺詐和拒付藝術家賠償的一邊?”
據外媒Gizmodo報道,一名網友在Discord軟件上利用AI生成的仿冒的網紅歌手Frank Ocean歌曲,并通過出售這些偽造的歌曲騙取了1.3萬美元;但另一面,加拿大歌手Grimes公開宣稱能夠接受他人利用自己的聲音合成歌曲,前提是支付給自己一半相應收益。
對版權的擔憂,其實早在AIGC音樂大規模推出前就已出現。“So-VITS-SVC4.0”產品界面上,即有如下警告:
中國人民大學知識產權學院副教授姚歡慶介紹:“首先涉及的是對歌手姓名權的侵犯,沒有經過別人的同意,說這是AI孫燕姿、AI王菲,等于很大程度上是借用了歌手的商業聲譽。同時,使用他人合法錄制的音樂作品制作錄音制品,可以不經著作權人許可,但應當按照規定支付報酬。而如果用A的音色演唱了B的歌曲,又涉及B歌曲的著作權。”
事實是,絕大部分被用以進行模型訓練的聲音素材,并不來自于正版錄音制品,而是網上,所以版權難以確認。“如果素材本身就是不合法的,那這本來就有侵權問題。”姚歡慶補充。
與其它平臺加碼監管不同,B站推出了“虛擬之聲創作計劃”,平臺鼓勵創作者根據要求對歌曲進行“原創、翻調、填詞、改編”,并給予流量扶持和獎勵,目前,這一活動已有近億次瀏覽。
監管與扶持并不矛盾,指向的都是以更“合規”的方式,推動AIGC創作市場的活躍。可作為參考的是,目前在AI繪畫領域,已出現人工畫家為作品添加“數字標簽”已防止作品被AI擅自學習訓練的趨勢。這一舉措,未來或也將被原創歌手參考。
音樂的未來,是精致還是“粗糙”
2017年,歌手泰琳·薩頓(Taryn Southern)與人工智能軟件合作推出專輯《I AM AI》,參與這一項目的人士預言,“音樂的未來將在人與人工智能的合作之間創造。”
《I AM AI》專輯
2021年,韓國推出了一檔名為《AI vs人類》的節目。其中,AI用已故歌手金光錫的聲音模仿演唱了金范秀的歌曲《想你》。《想你》創作于2002年,而金光錫早在1996年就已去世——AI“復活”了一名離開的歌手,唱了一首他不可能唱的歌曲。
國內,2022年酷狗也曾聯合楊超越推出“AI歌手楊超越”,涉及十幾首AIGC歌曲,利用技術彌補了楊超越的唱功。
AI其實早已在編曲、歌詞,乃至唱功層面,實現了對音樂創作領域的全面參與。但背后更值得思考的議題是,“AIGC對內容生產與消費”潛在的重構趨勢。
隨著創作工具不斷趨于“傻瓜化”、門檻與技術的下放,內容生產從PGC走向UGC,最終走向AIGC,內容創作由此進入“全民時代”。歌手、編曲家、詞作者、唱片公司在行業上下游中的地位都可能面臨一場“改寫”。過去,唱功被認為是一門藝術。但在“AI孫燕姿”的走紅中,唱功似乎大有淪為可復制的“方法論”的趨勢。
此時,歌手需要重新找尋自身的“壁壘”。對此,一個引人思考的故事是,在音樂節目《聲生不息》中,樂評人丁太升稱贊了歌手楊乃文的表演。他特別指出,“楊乃文在歌曲結尾處有一個高音沒有唱上去,雖然是一種瑕疵,但這也是最打動人的地方。現在的人們對技巧和技術有近乎病態的魔怔,但歌手應該有人的味道,否則把所有唱歌的工作交給AI就行了。”
可見,過去歌唱更像是一門追求“精致”的藝術,行業追求更高的高音、更平穩精準的聲線、更獨特的音色。但在AI對音樂行業的“競爭”下,精致似乎已不再是人類的強項。某些演繹時的“失誤”,因為更接近“人”,反而更打動人。
此外,當歌手成為“AI的養料”。如果積極地看待這件事,個性的AIGC創作無疑能帶動內容市場的多元化,間接提升背后歌手的知名度。但相應地,歌手也存在影響力“失焦”的風險。行業追逐的不再是歌手這個“人”,而僅僅是他的聲音。
所以對音樂圈來說,未來需要在人與AI之間,找到真正的“不同”。