【ITBEAR科技資訊】5月14日消息,OpenAI于今日凌晨正式推出了其新一代旗艦模型GPT-4o,這款人工智能模型具備實時推理能力,可處理語音、視頻及文本信息。
GPT-4o在英文文本與代碼處理方面與GPT-4 Turbo性能相當,然而,其在處理非英文文本上的表現有了顯著增強。更相較于當前市場上其他模型,GPT-4o在視頻與音頻理解方面展示出更優越的能力。
據ITBEAR科技資訊了解,GPT-4o的另一亮點在于其快速響應能力。該模型能以最快232毫秒的速度響應音頻輸入,平均響應時間為320毫秒,這一速度與人類在對話中的自然反應速度基本持平。
OpenAI正積極推動GPT-4o的廣泛應用。自推出之日起,GPT-4o的文本與圖片處理功能便已集成至ChatGPT中,供用戶免費使用。對于ChatGPT Plus用戶,其可處理的數據量上限將是免費用戶的五倍。此外,新版本的音頻模式也將在未來數周內向ChatGPT Plus用戶推送。
為驗證GPT-4o的實際性能,ITBEAR科技資訊進行了實地測試。盡管目前免費用戶尚無法使用圖片生成功能,但我們通過GPT-4o對圖片進行了描述與分析。測試中,GPT-4o能夠準確描述圖片內容,甚至能對圖片中的人物動作進行詳盡闡述,并最終以文字形式對圖片場景進行深入解析。
在進一步的測試中,我們使用了一張中文圖表和一張英文圖表對GPT-4o進行了分析能力的考察。對于中文圖表,GPT-4o不僅能準確讀取并解釋其中的數字含義,還能對數據的差異與趨勢進行詳盡的分析。對于英文圖表,GPT-4o同樣展現出了強大的理解能力,能夠讀懂、翻譯并根據圖表數據得出分析結論。
總體而言,GPT-4o的性能有了顯著的提升,無疑將為人工智能領域帶來新的可能性。