一直以來,“聲音”作為大腦中最基礎的記憶類型,為情感內容創造發揮重要作用。對于智能語音產品而言,聲音的表現力尤為重要。在人工智能飛速發展的今天,智能語音已經無處不在,通過富含多種情感的語音呈現,為我們的生活增添更多歡樂和色彩。
人機交互 越來越需要“感情”
從早期的機械化語音合成發展至今,在深度學習的推動下,語音合成的自然度和音質都得到了極大的提升。應用領域也從相對簡單、單一的場景,升級到更復雜、綜合的場景,對合成聲音的辨識度、情感表現力、節奏感等要求越來越高。事實上,不同場景和文本類型,對聲音的要求也不同。在日常語言對話中,我們通常會用一些明顯的情感信號來強化聲音的效果。例如,開心、憤怒、疑惑、驚懼等不同情緒下說同一句話,但聽起來的感覺是截然不同的。隨著人們對完全沉浸式視聽體驗追求的不斷增加,情感音色的重要性只增不減。人機交互過程中,人們越來越需要機器給予“感情”回饋,讓彼此的交流更有真實感。
情感合成 賦予AI語音“人情味”
如果說語音合成技術為機器人裝上了嘴巴,而情感合成則豐富了機器的情感表達。讓機器具有“人情味”,能“哭”會“笑”,滿足不同情境下的不同語意表達,為人機交互賦予情感溫度。例如,在智能客服場景,面對顧客投訴反饋意見時,智能客服需要用抱歉的情感音色來表達對顧客的歉意;在有聲閱讀中,不同角色、不同感情特征的聲音,更能推動故事情節的轉承起伏;在虛擬主場景里,一個熱情、有感染力的專屬IP聲音,更能調動觀眾的主動性。因此,如何讓合成語音具備人聲的情感表現力,成為語音合成重要發展方向。
標貝科技多風格多情感合成音色
標貝科技深耕AI語音交互領域多年,致力于語音交互技術的創新研發和商業化應用,推出包括普通聲音復刻、精品聲音復刻、TTS標準化定制等多種個性化音色定制解決方案。
對于語音合成的情感表現場景,標貝科技依托于成熟的深度學習技術,充分利用多風格情感語音大語料單獨預訓練技術,實現了風格拓展、情感控制等方面的重要突破,重新定義和升級了情感合成方案,實現了更加接近真人情感化表達的聲音效果。
近日,標貝科技再上新7個多情感發音人,包括3個男聲、3個女聲以及1個童聲音色。支持開心、生氣、可愛、安慰、中性等多種風格多種情感表達,適用于虛擬數字人、有聲讀物、紀錄片、直播、游戲解說等場景需求。
標貝科技多情感音色特點
▍多情緒多風格
標貝情感音色提供真實自然的開心、悲傷、驚訝、恐懼、厭惡、中性等多種情緒以及閑聊對話、客服、新聞等多種風格音色,以聲傳情,適用于不同情境下的不同語意表達。
▍音色效果真實飽滿
標貝情感音色基于成熟的深度神經網絡技術及新一代高音質合成系統生成,合成效果更接近真人的韻律、情感,真實流暢,可實現高度擬人化的情感表達。
▍場景音色定制化
支持情感強弱、語速、音量等關鍵聲音屬性調節,用戶可以根據場景的情感連續性,進行更加契合的語速和語氣調整,隨心創造專屬的情感音色。
目前,標貝科技多情感風格音色已經在標貝官網、標貝開放平臺同步上線。據悉,近期標貝還將上新更多的情感音色,歡迎各應用廠商、及企業開發者體驗接入。