8 月 3 日,eNet研究院,德本咨詢和《互聯網周刊》共同評選并發布了“2020人工智能語義識別創新排行”榜單,標貝科技憑借自主創新打造的AI歌曲合成解決方案成功入選,體現出自身語音技術實力和解決方案服務能力受行業機構廣泛認可。其中,與標貝一同入選的還包括百度、阿里、騰訊、小米等廠商,對應各家重點的語音產品服務。
(圖片來源:互聯網周刊)
AI技術的不斷進步,讓智能語音從單一商業模式向多元化商業模式的變遷,技術輸出的“厚度”增加,“邊界”擴大,也帶來了技術落地曲線的加速度增加。根據統計數據預測,2021年我國智能語音產業市場規模將突破100億元,在未來的幾年內將依舊保持高速增長。
而AI合成歌曲,作為語音技術生成應用延展體現,可針對虛擬偶像、虛擬歌姬、泛娛樂、智能硬件等場景,為客戶提供個性化語音解決方案,增強用戶交互體驗。
事實上,常見的歌曲合成軟件,會涉及到聲音的波形、包絡和頻率,為了讓歌曲聽起來更接近人聲,需要人工調節包絡和頻率,還需要用不同的合成方法進行對比優化,并且波形調節難度更高,即使經驗再資深的調教師輸出的作品,也會有明顯的機械痕跡。整體來說在操作使用、合成速度、應用效果等方面均有不足之處。
作為在智能語義場景下的創新應用,標貝科技打造的AI歌曲合成技術解決方案,采用AI神經網絡技術,可以自動化的對歌手聲音的參數進行調整,比如:節奏、和聲、力度、速度、調式等歌曲生成的重要參數。一站式的歌曲合成,讓用戶可以直接使用已訓練好的歌手聲音模型,無需更多的人工干預,輸入固定格式的樂譜即可合成想要的音樂,在合成效率和合成效果方面較歌曲合成軟件有顯著改善。
標貝語音技術負責人介紹,該方案主要面向大眾用戶,旨在提供娛樂化、個性化的使用體驗,借助 AI歌曲合成的歌聲不僅可以做到讓采樣原聲還原度很高,而且歌聲接近真人的歌唱水平,真實自然、優美動聽。
動聽的旋律、美妙合成歌聲背后是強大的語音技術和歌曲數據支持。標貝科技擁有完整的采標一體化解決方案,能夠實現快速產出高質量的不同音色、風格類型的的AI數據。目前標貝科技語音數據規模總時長超過10萬小時, 40余種明星IP音庫,20余種歌曲音庫;近百種合成定制庫,包括中美兒童/男女聲、粵語/臺語/韓語/日語/方言男女聲、智能客服、前端訓練集等;識別自有庫超過50種,包括成人、青少年/兒童、地方方言及小語種等。
隨著語音技術不斷發展,技術與用戶的關系將變得更加緊密,而AI歌曲合成的空間也隨之加大。標貝科技將加大技術創新投入,推出更多優質語音交互解決方案,與行業伙伴攜手推動行業快速發展。