自魔音工坊推出以來,受到了廣大自媒體用戶的喜愛,成為了名副其實的配音神器。目前的功能已經非常強大,并受到了很多大V的鼎力推薦,比如下面的這些幾百萬上千萬粉絲的短視頻達人們,就對魔音工坊贊譽有加:
但是產品再好,總是不如用戶心目中的產品好。這不,全網最挑剔的魔友們,總是對我們提出越來越高(變態)的要求。比如:
魔音工坊真厲害,不過,要是有重讀功能就更完美了。
如果魔音工坊可以把某個字拖音一下就更棒了。
要是魔音攻防能讓配音更有感情就好了,現在還是有點機械。
這里的某個字,合成效果有點兒瑕疵,有什么辦法可以編輯調節的么?
魔音工坊團隊無時無刻不被用戶的需求鞭策著。
為了解決上面的各種問題,我們的工程師,閱讀了無數的最新論文,想破了頭,或者解決起來技術難度太大,或者數據和研發的成本非常高,有一些功能要很好的解決,還需要每個發音人都投入巨大的成本。
好消息是,熬夜到脫發了的工程師們,找到了一個曲線救國的解決方案。雖然它不是終極的解決方案(靈丹妙藥),但是確實是非常好用的膏藥,一貼就靈,可以很好的實現「重讀拖音」「輕重緩急」的需求,一定程度攻克「情緒不足」的痛點,這個功能就是——聲音轉換。
來點兒產品功能介紹先。所謂的聲音轉換,學術術語叫做「說話人轉換」,英文名字叫 Voice Conversion,它的功能是把A的說話風格(節奏和韻律等)遷移到B上。轉換后的聲音,會有B的音色,并擁有A的節奏和韻律等信息。我們嘗試給這個功能取了幾個不同的名字,大家也可以稱之為聲音的「移花接木」,「鸚鵡學舌」功能,聽名字可能就會「顧名思義」一番,聯想到它的功能。
有了這個聲音轉換功能,可以解決什么問題呢? 總體而言,有了這個功能,每個人都是聲音的導演,它可以讓魔音工坊里的發音人,聽你的指揮,合成你想要的效果。這里列幾個使用場景給大家參考:
1、某個地方AI合成的效果不太好,比如破音,發音不清晰/不飽滿等,可以使用這個功能,讓你的AI主播,學習其他AI主播的播報效果,或者是學習你的朗讀效果。
2、某個地方需要重讀,但是AI卻輕描淡寫,這時候可以嘗試使用聲音轉換功能,實現「知輕重」的效果。
3、某個地方想要拖音,但是AI讀的比較短平快,這時候使用聲音轉換,可能就能實現「懂緩急」的效果啦。
4、某句關鍵的臺詞,AI合成的效果不夠出色,感覺AI配音的效果對不起忙了大半天的完美文案(比如視頻的開頭黃金10秒,用戶都希望配音能夠出彩)。這時候可以嘗試使用聲音轉換,讓你的精彩演繹,賦能給魔音工坊的AI發音人,讓聲音更生動,富于情緒,更有情感。
有了聲音轉換功能,你是不是已經有當好聲音大導演的沖動啦?
聲音轉換技術,不僅可以讓用戶用自己的聲音,或者其他人的聲音,來解決AI配音的不足,而且也可以用于聲音的實時變聲。比如在直播場景,可以定制帶有聲音轉換功能的話筒,把說話人的音色,實時轉換為某個特定的音色,比如蘿莉音。在一些虛擬偶像的場景,這樣的設備就很有想象空間。
變聲的另一個場景是,在通話中,想要隱藏自己的說話人身份,實現身份保密,希望童話中的聲音可以實現身份隱藏。這時候就可以使用說話人轉換技術,把電話這頭的聲音轉換為特定的AI發音人,這樣說話人的情緒可以實時傳達,又可以隱藏帶有說話人特征的音色信息。
隨著說話人技術的日漸成熟,相信魔音工坊可以讓每一個人都成為聲音的導演,讓AI發音人扮演好按需「發音」這個角色。