“前方路段擁堵,預計通行時間三分鐘……”
“早上好,今天是3月2日,星期三,農歷二月初一。天氣:晴轉多云,溫度 3 ~ 12℃,西北風二級......”
隨著人工智能語音設備的普及,語音合成技術也得到了廣泛應用,生活里的這些智能語音播報服務幾乎隨處可見。
語音合成,是通過計算機完成文本轉換語音的技術。為了讓機器“說話”聲音更加流暢自然,與用戶溝通更有效率,語音合成的連貫度、自然度、快速定制能力就十分重要。早期語音合成大多“機械感”強烈,使用場景單一,隨著語音合成效果的提升,應用場景和要求也越來越復雜。
例如,在智能車載設備或者智能家居場景下,既有一些實時查詢天氣、導航播報等在線功能,也有和終端設備相關的語音控制開關等功能。由于設備是移動狀態,不可避免會出現沒有網絡或者網絡信號不穩定。這種情況下,單一的在線合成或者離線合成都無法完全滿足設備的應用需求。前者音色豐富、情感飽滿,但是受網絡條件影響,會存在網絡抖動帶來合成失敗的情況;后者合成穩定,但是音色種類有限,并不能達到最優的音色質量要求。
離在線融合技術 給出語音合成最優解
作為國內領先的智能語音交互與AI數據服務提供商,標貝科技致力于智能語音技術應用邊界的探索,在語音合成方面進行了大量的創新研發,已經推出高自然度、多語種、效果穩定的在線以及離線語音合成服務,充分滿足企業和個人用戶多樣化聲音生產需求。
近日,標貝科技語音合成再次取得突破性進展,自研離在線融合技術,即將離線、在線SDK融合,用戶在網絡不穩定情況下,可以實現離線、在線合成兩種模式的靈活切換,同時兼顧了合成音色質量和響應速度的雙重要求。目前此項能力已經在標貝開放平臺上線,用戶可以體驗嘗鮮。
標貝科技離在線合成由統一的客戶端SDK作為開發接口,同一個接口既可以調用云端在線的合成引擎,同時也可以調用設備端的離線引擎,用戶根據自己的需求靈活接入即可。
在網絡環境穩定的情況下,為了追求更多的音質效果,用戶可以單獨接入在線的合成引擎。如果優先考慮合成效果穩定,同時對音質要求不是很高,就選擇純離線合成引擎。如果網絡環境頻繁波動,則可以使用離在線融合,在一定延遲的范圍情況下,自動選擇云端的結果,否則,就采用離線的結果。標貝科技離在線合成切換的邏輯已經內置在SDK中,開發者只需要考慮接入一個SDK,就能獲取局部最優的效果。
(三種合成模式路徑)
同時,為了提高離線合成的音色質量,標貝科技推出離在線融合語音合成能力的同時,還在原有離線合成基礎上,升級了高音質的離線合成3.0版本,聲音效果更自然飽滿,富有情感表現力,包括3個女聲及2個男聲共5個音色,用戶可以結合使用需求,自由地選擇發音人,享受媲美在線合成的優質體驗。
應用場景方面,如有聲閱讀、車載交互、智能設備等,如果用戶對合成音色質量要求比較高,同時網絡情況良好,就可以優先選擇在線合成服務。目前標貝科技在線合成發音人多達100余種,無論是知性、柔美、溫和的女聲,陽光、磁性、渾厚的男聲,還是活潑、可愛、俏皮的童聲,均可靈活選擇。如果用戶網絡不穩定,又對響應速度有較強的需求,則可以選擇標貝離在線融合語音合成,我們可以根據網絡實時情況,實現在線、離線合成的流暢切換,確保最終的語音合成效果。
標貝科技語音技術產品負責人表示,目前市場上能做到離在線融合語音合成能力的企業并不多,通過技術的產品化,是標貝科技在智能語音交互場景化落地的深刻思考。隨著人機交互潮流的到來,用戶對于語音合成的品質及效率也會有更高的要求。標貝科技離在線融合語音合成技術打破了對人機交互對網絡條件的高依賴,極大的提高了人機交互的便利。
作為深耕語音交互領域多年的品牌,標貝科技通過一次次升級和迭代,實現越來越多的場景下用戶需求。未來,標貝科技將持續深耕AI語音交互技術,深化離在線語音合成能力,帶給用戶極致的語音交互體驗。