【ITBEAR科技資訊】8月2日消息,據(jù)悉,meta在今天宣布開源了一款名為AudioCraft的生成式AI工具,該工具為音樂家和聲音設計師提供了一種全新的靈感來源,幫助他們以創(chuàng)新的方式迭代自己的作品。該工具包含三個核心組件:MusicGen、AudioGen和EnCodec(改進版)。
在這三個核心組件中,MusicGen是其中之一,它是基于谷歌2017年推出的Transformer模型的AI語言模型。MusicGen能夠將文本和已有的旋律轉化為完整的音樂作品,從而幫助音樂創(chuàng)作者們更輕松地進行音樂生成。
另外一個核心組件是AudioGen,它通過使用公共音效進行訓練,能夠生成音頻或擴展現(xiàn)有音頻,甚至可以產生各種環(huán)境音效,如狗叫、汽車鳴笛、木地板上的腳步聲等。這為聲音設計師提供了更多可能性,讓他們能夠創(chuàng)造出更加豐富多樣的音頻效果。
最后一個核心組件是EnCodec(改進版),它是基于神經網絡的音頻壓縮解碼器。EnCodec的獨特之處在于,它可以生成更高質量的音樂并減少人工痕跡,還能對音頻文件進行無損壓縮。這使得音樂的生成和處理過程更加高效和便捷。
據(jù)ITBEAR科技資訊了解,這些開源的AI工具不僅為相關研究人員和從業(yè)人員提供了訓練模型的機會,還能長期穩(wěn)定地生成高質量音頻,為創(chuàng)作者們帶來了更廣闊的創(chuàng)作空間。meta的AudioCraft系列模型為音樂和聲音設計領域注入了新的活力,助力人們以創(chuàng)新的方式表達自己的創(chuàng)作理念。