【ITBEAR科技資訊】5月14日消息,OpenAI最新公布了其旗艦生成式AI模型GPT-4o,并計劃向所有用戶免費提供,ChatGPT Plus用戶將在未來幾周內優先體驗。
GPT-4o,其中的“o”蘊含著“omni”即全面、全能的含義。這款模型被視為人機交互更自然化的重要進步,因為它不僅能處理文本,還能接受音頻和圖像的各種組合輸入,并產生相應的組合輸出。這種跨模態的交互能力,無疑將為用戶帶來更為豐富和直觀的AI體驗。
據ITBEAR科技資訊了解,GPT-4o的反應速度令人印象深刻,它能在232毫秒內對音頻輸入做出回應,平均反應時間為320毫秒,這與人類在自然對話中的反應時間非常接近。在性能上,GPT-4o在英語和代碼文本方面的表現與GPT-4 Turbo旗鼓相當,同時在非英語文本處理上也有顯著提升。更新模型在API調用上更為迅速,而且價格降低了50%,這無疑將極大地提升其市場競爭力。在視覺和音頻理解方面,GPT-4o展現出了卓越的性能,明顯優于現有的其他模型。
OpenAI介紹,使用GPT-4o時,ChatGPT免費版用戶將能體驗到更多高級功能,如GPT-4級別的智能交互,從模型和網絡中獲取回復,利用數據創建圖表,基于拍攝的照片進行對話,以及上傳文件以獲取總結、撰寫或分析等。
在預熱階段,OpenAI的CEO阿爾特曼就對GPT-4o寄予了高度評價,形容它“像魔法一樣”。他甚至在一次采訪中表示,希望最終能開發出像科幻電影《她》中的那種AI助理,實現更為深入和自然的人機交互。
此次發布的新模型也引發了業界的高度關注。前DCCI互聯網數據中心創始人胡延平在微博上表示,“這是一次看似小幅更新,實則可能引發智能交互領域巨大變革的進步。”他還暗示,這次發布可能不僅僅是GPT-4的后端能力與前端聊天機器人的結合,而是GPT-5能力的部分釋放,顯示出OpenAI在控制其技術發布的節奏上有著深思熟慮的策略。