【ITBEAR科技資訊】9月22日消息,生成式人工智能(AI)正風靡全球,與AI進行聊天的用戶對文本轉語音的自然性和表現力提出了更高的要求。為滿足這一需求,微軟今天宣布推出了四款全新的TTS(Text-to-Speech)語音模型,分別是en-US-AndrewNeural、en-US-BrianNeural、en-US-EmmaNerual和zh-CN-YunjieNeural,目前已在美國東部、東南亞和西歐三個市場提供公共預覽版。
據ITBEAR科技資訊了解,這四款TTS語音模型旨在為用戶提供更加自然的語音交互體驗,使聊天過程更加貼近現實、更加自然,更具吸引力。這意味著在與AI進行對話時,用戶將能夠聽到更加流暢、自然和富有情感的語音輸出。
微軟在新聞稿中展示了這四款TTS語音模型的對比效果,并演示了它們在不同語氣風格下的表現。這些演示可通過提供的鏈接進行深入體驗。
此外,微軟還提到開發者可以利用Azure Speech SDK和REST API,將這些先進的語音模型集成到他們現有的應用程序中。這為開發者提供了機會,利用這些語音模型來增強他們應用程序中的語音交互功能,從而創建更智能、更人性化的語音助手、虛擬角色和其他語音應用程序。這一舉措將推動語音技術在各個領域的應用和創新,為用戶帶來更出色的體驗。