10 月 20 日消息,世界上大約 7000 種已知的語言中,有 40% 沒有標準的書寫系統(tǒng)。這些沒有文字的語言給現(xiàn)代機器學習翻譯系統(tǒng)帶來了一個獨特的問題,因為翻譯通常需要先將口頭語言轉(zhuǎn)換為書面文字,翻譯后再將文字還原為語音。不過 Meta 公司 10 月 19 日宣布,已經(jīng)通過其最新的開源語言人工智能(AI)解決了這個問題。
Meta 公司公布了“第一個由人工智能驅(qū)動的無文字語言的語音翻譯系統(tǒng)”,該系統(tǒng)成功地翻譯了閩南語,這是一種主要在臺灣地區(qū)使用的口頭語言。
該系統(tǒng)是 Meta 公司人工智能項目的一部分,被稱為“通用語音翻譯器(UST)”。Meta 公司在一份聲明中說:“該翻譯系統(tǒng)是 Meta 人工智能的通用語音翻譯器項目的第一個里程碑,該項目專注于開發(fā)人工智能系統(tǒng),提供所有語言的實時語音到語音翻譯,甚至無文字語言。”該項目正致力于開發(fā)更多實時語音到語音的翻譯,以便元宇宙居民更方便地互動。
Meta 說,以前大多數(shù)人工智能驅(qū)動的語言翻譯工作都集中在書面語言上,但其目標之一是翻譯更多缺乏正式書寫系統(tǒng)的語言。據(jù) Meta 公司稱,目前有 7000 多種語言,但“超過 40% 的語言主要是口語,沒有標準的或廣為人知的書寫系統(tǒng)。”
Meta CEO 馬克-扎克伯格在發(fā)布在 Facebook 上的視頻中演示了該用該系統(tǒng)翻譯閩南語,并表示 Meta 公司將對該工具進行開源,以便人們可以使用新的人工智能系統(tǒng)來翻譯更多的語言。
來源:IT之家