【ITBEAR科技資訊】7月31日消息,OpenAI公司近日揭曉了一項(xiàng)創(chuàng)新功能,即向部分付費(fèi)訂閱的ChatGPT用戶開放了全新的高級(jí)語音模式(Advanced Voice Mode)。此模式旨在為用戶提供更為自然流暢的實(shí)時(shí)對(duì)話體驗(yàn)。
這一高級(jí)語音模式的亮點(diǎn)在于其能夠理解并響應(yīng)情緒及非語言暗示,顯著提升了與人工智能進(jìn)行實(shí)時(shí)、自然對(duì)話的可能性。今年五月,OpenAI便首次向公眾展示了其GPT-4o模型以及這一令人矚目的“高級(jí)語音模式”。
據(jù)ITBEAR科技資訊了解,GPT-4o模型對(duì)音頻輸入的反應(yīng)速度令人印象深刻,僅需232毫秒便能做出回應(yīng),而平均反應(yīng)時(shí)間也維持在320毫秒左右,這與人類在日常對(duì)話中的反應(yīng)速度相當(dāng)。這一突破性的反應(yīng)速度得益于高級(jí)語音模式的設(shè)計(jì)理念,它摒棄了傳統(tǒng)語音模式中將語音轉(zhuǎn)換為文本,再將文本轉(zhuǎn)回語音的繁瑣過程,從而大幅降低了交互的延遲。
OpenAI自展示高級(jí)語音模式以來,一直致力于增強(qiáng)語音對(duì)話的安全性與品質(zhì)。為確保用戶體驗(yàn)的安全與舒適,OpenAI已經(jīng)實(shí)施了多項(xiàng)防護(hù)措施,以屏蔽涉及暴力或侵犯版權(quán)的內(nèi)容請(qǐng)求。
盡管OpenAI原計(jì)劃在六月底就推出這一功能,但為確保產(chǎn)品的完善與成熟,公司決定延后一個(gè)月發(fā)布。目前,OpenAI已明確表示,高級(jí)語音模式將在今年秋季逐步向所有ChatGPT Plus訂閱用戶開放。這一創(chuàng)新功能的推出,無疑將為用戶帶來更加智能、高效的語音交互體驗(yàn)。