【ITBEAR】9月13日消息,OpenAI于今日凌晨正式推出了全新的預(yù)覽模型——OpenAI o1,該模型在復(fù)雜推理任務(wù)上展現(xiàn)了前所未有的人工智能能力。
據(jù)悉,o1模型的特點(diǎn)是在回答問(wèn)題前會(huì)進(jìn)行更長(zhǎng)時(shí)間的思考,模仿人類解決問(wèn)題的思維方式。OpenAI曾將2023年發(fā)布的GPT-4比作高中生水平的智能,而o1模型則被視為AI從“高中生”躍升至“博士”的關(guān)鍵步驟之一。
據(jù)ITBEAR了解,在國(guó)際數(shù)學(xué)奧林匹克的資格考試中,o1模型取得了令人矚目的成績(jī),獲得了83%的分?jǐn)?shù),相比之下,GPT-4o僅能解決13%的問(wèn)題。在編程能力方面,o1模型在Codeforces比賽中也展現(xiàn)出了卓越的實(shí)力,取得了89%的百分位成績(jī),遠(yuǎn)超GPT-4o的11%。
OpenAI表示,根據(jù)他們的測(cè)試,未來(lái)更新版本的AI在物理、化學(xué)和生物學(xué)等挑戰(zhàn)性基準(zhǔn)測(cè)試中的表現(xiàn),有望與博士生水平相媲美。與現(xiàn)有的大模型如GPT-4o相比,o1模型不僅能解決更復(fù)雜的推理問(wèn)題,還能改善之前模型中存在的機(jī)制性缺陷。
在o1模型中,AI通過(guò)不斷試錯(cuò)和打磨答案,顯著提高了生成結(jié)果的準(zhǔn)確率和質(zhì)量。這一特點(diǎn)在解答編程問(wèn)題時(shí)尤為突出,o1模型會(huì)在動(dòng)手編寫代碼之前,先完整思考整個(gè)解答流程。
OpenAI還宣布,從9月12日起,ChatGPT的訂閱用戶將能夠訪問(wèn)這兩個(gè)新模型。其中,o1-preview模型每周消息數(shù)量限制為30條,而o1-mini模型則為50條。
隨著OpenAI o1模型的推出,人工智能在復(fù)雜推理和問(wèn)題解決能力上邁出了重要的一步,標(biāo)志著AI技術(shù)向更高水平的發(fā)展。#OpenAI# #o1模型# #復(fù)雜推理# #人工智能# #GPT-4與o1對(duì)比#