來源:品玩
Meta 今天推出大模型產(chǎn)品 Voicebox,這是一款語音生成產(chǎn)品。
據(jù) Meta 表示,Voicebox 可以合成英語、法語、德語、西班牙語等六種不同語言的語音,除了可以根據(jù)文本生成語音內(nèi)容外,還可以進行去噪、內(nèi)容修改,風格轉換等任務。該模型基于 Flow Matching 技術,可以對擴散模型進行改進。
據(jù)研究團隊表示,Voicebox 的內(nèi)容正確率和音頻相似率均優(yōu)于現(xiàn)有產(chǎn)品,且有著更快的速度。