OpenAI在科技界再次投下震撼彈,其最新推出的o1大模型不僅在科學、代碼及數學領域展現出了卓越的問題解答能力,更是在智能化、多模態輸入及思考速度上實現了顯著飛躍。與今年9月首次亮相的o1-preview和o1 mini版本相比,此次面世的o1模型解鎖了更多潛力。
OpenAI的首席執行官Sam Altman在發布會上透露,相較于o1-preview,o1模型在減少重大錯誤率方面取得了顯著成效,降低了約34%,同時思考速度提升了近50%。Altman強調,o1的獨特之處在于其每次回答前都會進行深度思考,這一特性讓它能夠給出更為詳盡且準確的答案,遠超其他同類模型。
在數學等復雜問題上的表現,o1更是展現出了令人矚目的準確率。據透露,o1模型在解答AIME 2024數學競賽題目及博士級科學問題時,準確率分別高達78.3%和75.6%,與o1-Preview相比,分別提升了28.3%和1.5%。這一進步無疑為科學研究和學術探索提供了新的強大工具。
在回答速度方面,o1同樣表現出色。在離線測試環境中,o1的平均響應速度比o1-Preview快了約60%。在一次直播演示中,當被要求列舉公元2世紀的羅馬皇帝并簡述其生平時,o1僅用了14秒便完成了任務,而o1-Preview則耗時33秒。OpenAI還優化了模型的響應時間,現在,對于簡單問題,o1能夠迅速作答;而對于復雜問題,則會花費更多時間進行深入思考。
o1模型還新增了多模態輸入能力,能夠同時處理圖片和文本內容,并進行邏輯推理。在一次演示中,OpenAI展示了一張包含太陽、冷卻系統等物體的手繪草圖,以及不同數值。當這張照片被上傳給o1后,o1在沒有任何提示的情況下,不僅生成了用戶可能想問的問題,還自動給出了正確答案。在不到10秒的時間內,o1不僅理解了草圖的問題要求,還意識到缺少的參數,并通過自我推理得出了正確答案。
為了滿足用戶不受調用限制使用模型的需求,OpenAI推出了全新的訂閱機制——ChatGPT Pro。用戶只需每月支付200美元,即可無限制地使用更強大的o1模型——o1 Pro。在展示o1-Preview、o1及o1 Pro在數學競賽、代碼競賽及博士級科學問題上的回答差異時,OpenAI發現,在每個問題詢問四次后,o1 Pro的可靠準確率最高,分別達到80.0%、74.9%和74.2%。