6月19日消息:ChatGPT 和 Google 的Bard 等生成式人工智能使用自然語言處理和機器學習生成特定文本以響應提問。Meta 的新生成人工智能 Voicebox 做事有點不同——生成任意音頻。
Facebook 的母公司 Meta 在日前宣布了一項名為 Voicebox 的新型生成式人工智能技術。Voicebox 可以利用一段 2 秒鐘的音頻樣本合成語音。通過這個樣本,它可以匹配音頻風格,并進行文本轉語音生成,或重新創建可能被外部噪音打斷的語音部分。Voicebox 還可以利用這個樣本,將英文文本朗讀成其他語言,比如法語、德語、西班牙語、波蘭語或葡萄牙語。
Meta 表示,Voicebox 可以為虛擬助手或元宇宙中的非玩家角色提供自然真實的語音。元宇宙是人們在其中聚集工作、娛樂和交流的數字世界。它還可以被視力受損的人使用,讓他們聽到朋友們的聲音來朗讀信息。
Voicebox 仍處于研發階段,尚未向公眾提供。Meta 表示,他們意識到這種人工智能技術可能帶來的潛在危害,并正在努力找到一種有效的方式來區分真實語音和由 Voicebox 生成的音頻。
【來源:站長之家】