【ITBEAR】智譜公司今日揭曉了其最新研發成果——GLM-4-Voice,一款端到端情感語音模型。該模型不僅具備情感理解與表達能力,還能實現情感共鳴,為用戶帶來更為真實的交互體驗。用戶現在即可通過“智譜清言”App,親身體驗這一創新技術。
GLM-4-Voice的亮點在于其豐富的情感表達和細膩的變化,能夠準確傳達高興、悲傷、生氣、害怕等多種情緒。同時,它還支持語速調節,用戶可根據需要隨時要求加快或放慢語速。該模型還具備隨時打斷和靈活輸入指令的功能,使得對話互動更加自然流暢。
在語言支持方面,GLM-4-Voice表現出色,不僅支持中英文語音,還能識別中國各地方言,如粵語、重慶話、北京話等。該模型還即將上線視頻通話功能,實現邊看邊說的全新交互體驗。
智譜的另一大亮點AutoGLM也備受矚目,它具備phone use能力,能夠模擬人類操作手機,無需用戶手動搭建復雜工作流,操作邏輯與人類相似。
GLM-4-Voice已同期對外開源,成為智譜首個開源的端到端多模態模型。感興趣的用戶可訪問以下代碼倉庫了解更多詳情:
https://github.com/THUDM/GLM-4-Voice
GLM-4-Voice的開源將有助于推動相關領域的進一步研究與發展,為行業注入新的活力。