開車途中,有清晰明快的智能語音導航為你播報最新路況;
撥打咨詢電話,有溫柔甜美的智能客服為你答疑解惑;
家庭生活里,有活潑可愛的語音助手為你省下不少麻煩操作;
甚至當你不想看書,還有各種情感合成聲音為你營造帶入感十足的聽書體驗……
當前,隨著智能語音交互越來越普及,聲音逐漸成為生活中重要的一部分。而合成聲音賦予語音產品不同的“性格”,讓其與用戶的溝通更加“人性化”。
伴隨著語音合成技術應用不斷深入,應用場景的日益多樣化對聲音效果也提出了更高的要求。如何賦予合成聲音更多的情感表現力和個性化功能,成為各大智能語音產品快速占領市場的核心競爭力。
品質升級
為滿足各行業客戶的多元化商業需求,此前標貝科技已經上線了一批24K高保真音色,細膩飽滿的情感表現力贏得客戶一致好評。近日,標貝科技再上線4個24K新音色,包括2個中文發音人、2個美式英語發音人,每個聲音都經過精挑細選,各有特色。
▍24K中文發音人
童聲貝童:聲音純真可愛充滿活力,適合故事閱讀、語音助手等場景
男聲貝明:聲音溫和,穩重可信,適合智能客服、產品解說等場景
▍24K美式英語發音人
男聲貝洛伊:聲音清晰明朗,高仿真人,適合新聞播報、語音導航等場景
女聲貝漢娜:聲音親切自然、富有情感,適合有聲閱讀、影視配音等場景
功能升級
不僅聲音質量提升,此次標貝語音合成還全新上線字級別時間戳功能,給用戶帶來更便捷的畫音同步體驗。
使用智能語音配音的朋友經常會遇到一個問題:在視頻播放過程中,變成聲波的語音,很難控制目前需要讀到了哪一句、哪個字,無法靈活實現聲音字幕和畫面同步匹配的效果。
針對這個問題,標貝將過去的音子級別時間戳優化到字級別時間戳,即用戶在使用語音合成服務輸出音頻流時,通過標貝字級別時間戳,可以實現實時輸出每個文本在音頻中的時間位置。尤其是,不僅可以準確的對齊文字,數字、引文、特殊符號等也能直接對齊到原始文本,不需要其他轉換的工作,有效解決了畫音同步的難題。
在應用場景方面,標貝字級別時間戳可以賦能有聲讀物、視頻配音體驗。例如,有聲新聞、有聲故事、兒童讀物等設備大多支持屏幕根據播報聲音顯示文字。但是現有技術只能做到整行整句顯示字幕,兒童無法根據聲音來認字學字。標貝字級別時間戳則可以根據朗讀的聲音,在設備屏幕上實現逐字高亮顯示,讓用戶快速、準確的定位當前播報的文字,也方便了兒童聽音識字。
標準化TTS定制推動智能語音產業規模化發展
據前瞻網統計,2020年中國智能語音市場規模達到113.96億元,同比增長19.2%,預計2026年中國智能語音市場規模將進一步增長,達到326.88億元。隨著人工智能應用的普及以及基礎設施成熟,智能語音作為人機交互的重要入口,將迎來大規模商業化落地階段。
優質的聲音是智能語音產品獲得良好用戶體驗的第一要素。要求合成聲音不僅具備情感表現力,更要匹配當前的業務場景需求。標貝科技基于強大的數據能力及深度學習技術,提供標準化TTS定制服務,可以滿足不同層面客戶的定制化需求。
例如,賦予智能客服更具人情味的音色,讓用戶感受真實可靠;打造語音助手的專屬聲音IP,與用戶產生情感互動;為有聲閱讀提供豐富的情感合成音色,帶來更具沉浸感的聽書體驗……
目前,標貝科技累計語音合成音色種類多達100余種,包括男聲、女聲、老人、童聲等多音色,中文、英文、中英混讀、小語種、方言等多語種,廣泛服務智慧金融、教育、電子商務、安防、自動駕駛、泛娛樂等多領域。未來,標貝科技將繼續以技術創新為核心,持續優化服務能力,打造更優質、更落地的語音交互方案,為企業創造更大的商業價值,為智能語音產業高速發展貢獻力量。