如今,標準、清晰的AI合成語音已經深入日常生活,被廣泛應用在語音助手、智能客服等領域。但如果你想在小說閱讀或者影視配音場景下,使用同樣「平鋪直敘」的合成音色來演繹表達角色的性格特點、情緒起伏,那效果可能就要大打折扣了。不僅難以增強文本生動性和感染力,也難以為用戶營造身臨其境的沉浸感。
那有人就會問了:
AI合成聲音能不能做到情感化配音,通過不同情緒來真實自然的展現人物的情感變化?
在不同的段落情節里,AI合成聲音能不能做到角色需要的例如哭泣、大笑、害怕等極具表現力的情緒需求?
為了讓AI合成聲音也能「哭」會「笑」,像真人一樣在語氣、語調、情感等方面表現自己,增強與之交流的用戶的融入感,標貝科技通過對聲音感情的定義,推出情感合成方案,提供喜怒哀樂四個維度六種不同的情感表達,讓聲音更富有表現力,提升更多場景下的語音交互體驗。
自標貝情感合成推出以來,受到了廣大用戶的喜愛,成為名副其實的配音神器,特別是在有聲閱讀場景,每個故事、小說里都有大量的人物和情節,用戶可以根據情節發展需要,搭配不同的情感聲音,推動故事的轉承起伏,讓有聲讀物更有“人情味”。
近年來,“虛擬偶像”和“元宇宙”爆火,為了滿足更多細分場景應用,標貝科技再次推出二次元情感合成發音人——未眠小姐姐,打破虛擬偶像發音機械感強、無法場景化、需要人工反復調節聲音參數導致不穩定等難題,讓虛擬偶像的形象更為鮮活。
未眠小姐姐發出的喜、怒、哀、懼配音都是由標貝情感合成技術完成。用戶可以明顯感受到人物每一句聲音情感的變化,當想要表達高興的情緒時,合成聲音會展現歡快喜悅的聲音;表達悲傷的情緒時,則顯現憂愁凄涼的聲音;表達憤怒的情緒時,則是郁悶生氣的聲音;表達害怕的情緒時,則是慌張驚恐的聲音。
據標貝科技相關語音負責人介紹,如何讓聲音富有情感和表現力一直是語音合成技術的一大難點。為了保證合成語音的真實、自然,標貝情感合成依托于成熟的深度學習技術,通過強大的情感數據庫,不斷對合成模型進行優化訓練,最終實現高音質、高自然度與多情感的聲音表現,在韻律表現、聲音層次感、情感表達等方面均接近真人表達,充分滿足用戶的個性化需求。
標貝科技情感合成技術特色
• 多情緒自然切換
告別只會一個音調的 “機械音”,標貝情感合成提供真實自然的開心、憤怒、悲傷、驚訝、恐懼、厭惡六種情緒下的聲音,讓AI機器和人一樣能“哭”會“笑”,以聲傳情,適用于不同情境下的不同語意表達。
• 音色效果真實飽滿
標貝情感合成基于成熟的深度神經網絡技術,并結合TTS3.0新一代高音質合成系統,使音色達到自然的抑揚頓挫、情感起伏,帶給用戶幾近真人,流暢舒適的聽覺體驗。
• 場景音色定制化
標貝情感合成方案可以充分滿足有聲閱讀、兒童教育、車載、泛娛樂等多場景應用需求。例如,針對有聲閱讀場景,標貝情感合成可以針對風格適配度、情感連續性、段落疲勞度進行更加契合的語速和語氣,保證合成的效果足夠接近真人且具有沉浸感;在泛娛樂虛擬偶像應用里,讓虛擬人具備和真人一樣的情感表現力,互動更加生動有趣。
情感合成有效改變了傳統的人機交互模式,實現人與機器人的情感交流。未來,隨著AI技術對聲音應用領域賦能進一步落地,更多智能化的娛樂生活場景必將到來。標貝科技將持續加大技術創新投入,不斷優化完善情感合成方案,打造更有溫度的情感聲音,助力場景化應用升級。