5 月 23 日消息,Meta 公司推出了 Massively Multilingual Speech(MMS)項目,為 1100 多種語言提供了先進的語言轉文本、文本轉語音服務,且支持將近 4000 多種未標記的口語。
Meta 為 MMS 項目整合了自我監督學習工作 wav2vec 2.0 和一個新的數據集,通過實測發現 MMS 優于現有模型,且支持的語言數量是其 10 倍。
Meta 創造這項成就的關鍵在于引入了龐大的音頻數據集,其中包含 1100 多種新約圣經(New Testament)的朗讀內容。Meta 表示整合該音頻數據集之后所產生的語音模型在男性和女性聲音中表現同樣出色。
【來源:IT之家】