【ITBEAR】在萬眾矚目的新加坡OpenAI開發(fā)者日活動中,ChatGPT再度展現(xiàn)了其非凡的實力。最新版本的ChatGPT-4o(簡稱4o)在備受關注的大模型競技場中一舉奪魁,將此前占據(jù)榜首的Gemini拉下了馬。
此次4o的更新重點在于“創(chuàng)意寫作能力”,據(jù)官方介紹,新版本能夠生成更加自然、吸引人且有針對性的文本,顯著提升了文本的相關性和可讀性。4o在處理上傳文件方面也進行了優(yōu)化,能夠提供更深入的見解和更全面的回應。
o1的核心貢獻者Karina Nguyen對此次更新表示了肯定。她指出,作為Canvas功能的一部分,改進寫作是一個頂級用例,有望改變?nèi)藱C協(xié)作的方式,讓創(chuàng)作過程更具創(chuàng)造性。盡管她承認這一研究問題非常主觀且開放,但至少在寫作方面取得的進展對于實現(xiàn)AGI(通用人工智能)的創(chuàng)造性智能至關重要。
在大模型競技場的創(chuàng)意寫作分榜上,新版4o(ChatGPT-4o-1120)的得分從上一個版本的1365躍升至1402,進步顯著。同時,在代碼能力、數(shù)學能力、困難任務以及風格控制等多個方面,4o也均有所提升,成功從之前的第二名躍升至第一名。
然而,盡管4o的表現(xiàn)亮眼,但網(wǎng)友們對于OpenAI遲遲未推出o1滿血版仍表示不滿。一些網(wǎng)友在社交媒體上直言,希望OpenAI能夠盡快放出o1,與近期備受矚目的DeepSeek等模型進行正面較量。甚至有網(wǎng)友調(diào)侃稱,OpenAI的更新策略似乎就是每當有其他模型登上榜首時,便迅速推出新版本奪回第一。
盡管4o在創(chuàng)意寫作方面取得了顯著進步,但仍有網(wǎng)友對其生成的內(nèi)容進行了測試,并發(fā)現(xiàn)系統(tǒng)仍能夠準確識別出這些內(nèi)容為AI所寫。不過,也有網(wǎng)友對4o的更新進行了深入研究,并發(fā)現(xiàn)OpenAI在系統(tǒng)提示詞方面進行了優(yōu)化,新增了一道護欄,以確保ChatGPT在敏感話題上不會胡說八道。
目前,新版4o已在大模型競技場中上線,感興趣的讀者可以前往體驗并分享自己的感受。對于未來OpenAI是否會推出o1滿血版,以及它將如何與其他模型進行競爭,我們拭目以待。