為拓寬智能語音使用場景,滿足各行業客戶的多元化需求。近日,標貝科技上線3個自由對話場景的新音色,在解說訪談、影視配音、故事小說等對音色要求更靈活的場景中,新音色的自然流暢,對簡短語氣詞的停頓處理以及口語化表達,給用戶帶來更真實、更舒適的語音交互體驗。
技術升級 實現高保真多情感音色表現
人工智能時代的到來,推動了智能語音產業進入蓬勃發展階段,語音服務的重要性不斷凸顯。從單調的機器人喚醒、機械的語音導航系統、冷冰冰的智能客服,到如今智能產品可以發出媲美真人的合成聲音。用戶對語音交互的需求越來越大,要求也越來越高。
標貝科技專注智能語音交互領域多年,始終致力于語音技術的創新研發和商業化應用。近兩年,得益于深度神經網絡技術的不斷進步,標貝科技語音合成(TTS)技術也取得了突破性進展,深度學習端到端系統對不同角色和情感表達的判斷更加準確,高效且真實的還原波形,最終輸出的合成聲音在韻律表現、音色層次感、情感表現力方面均接近真人表達。
目前,基于先進的語音合成技術,標貝科技已經建立了上百個覆蓋不同語言和場景的自有版權音色庫,支持中文、英文、中英混讀、小語種、方言(東北話、天津話、四川話、粵語、臺灣話)等多個語種。有適用于小說閱讀的情感音色,有契合于智能客服的客服音色,有匹配語音助手的對話音色,也有適合影視配音的多風格特色音色等,賦予眾多語音產品“能說會道”的能力。
深耕“AI+場景”快速助推語音產品商業化應用
音色是指不同聲音的頻率表現在波形方面有與眾不同的特性。音色是聲音的特點,不同的發聲體由于其材料、結構不同,則發出的聲音的音色也不同。例如鋼琴、吉他和人的聲音不一樣,每一個人的聲音也不一樣。
隨著智能語音應用滲透到各個場景,AI聲音不僅是一項基本人機交互能力,更被賦予了很多品牌屬性。在實際的應用中,基于領域和場景的要求,智能語音產品往往需要一個具有高識別度的個性化的聲音,代表自己企業及產品的品牌形象。
經過多年的技術積累沉淀,標貝科技已逐步形成了一套成熟的技術方案,覆蓋從聲音畫像的設計、數據的采集和標注、模型的優化和最終部署上線的全流程,實現一站式商業化服務。
同時,依托于標貝大量的自有數據,標貝科技訓練了性能優異的基礎模型,實現音色定制對數據的要求從傳統的幾萬句話降低到幾百句話,大大節約了時間成本和數據成本。可以快速為企業定制豐富的代表性音色,實現品牌價值的最大化。
據介紹,標貝科技音色定制服務已經在金融機構、互聯網通信、電商物流、新媒體等領域得到應用,涉及客戶服務、AI對話和內容生產的多個場景。
例如,助力中國銀行在手機銀行APP上線親子陪伴產品“BOBO留聲機”,家長錄制5分鐘上傳聲音,即可復刻自己聲音給孩子講故事,提供智能化的兒童成長服務體驗。為恒生電子、慧捷、招商銀行、民生銀行等企業打造智能客服方案,提供實時語音導航、自動外呼、銷售輔助等服務,提升客服坐席人員的工作效率與服務質量。為人民日報打造新媒體音視頻解決方案,定制新聞男、女音色,并成功在人民日報客戶端和小程序FM端上線應用。
同時,標貝科技還基于語音場景和客戶需求的不斷深入,進行聲音轉換、AI歌曲合成等在內的語音延展技術開發,在虛擬偶像、短視頻等場景有巨大的市場應用空間。
未來,隨著智能語音產業的發展,機器所生成的合成聲音必然會越來越生動,并走向大規模商業化應用。標貝科技也將不斷加大對語音交互技術的研發投入,通過技術產品的不斷迭代和升級,打造更有溫度的聲音,賦能更多場景,為智能語音行業創造更大的價值。