【ITBEAR科技資訊】7月17日消息,近日,一道看似簡(jiǎn)單的數(shù)學(xué)題“9.11和9.9哪個(gè)大?”在國(guó)外社交平臺(tái)上引起了廣泛關(guān)注。這道題不僅令國(guó)外的三大旗艦大模型ChatGPT 4o、谷歌Gemini Advanced和Claude 3.5 Sonnet紛紛“翻車”,也在國(guó)內(nèi)激起了一波測(cè)試熱潮。
網(wǎng)友們紛紛好奇,如果讓國(guó)內(nèi)的大模型來(lái)解答這道題,結(jié)果會(huì)是如何呢?于是,百度文心一言、阿里通義、騰訊元寶、字節(jié)豆包、百川智能百小應(yīng)、零一萬(wàn)物萬(wàn)知、智譜清言以及月之暗面的Kimi,還有好未來(lái)的九章大模型等9款大模型都被拉來(lái)答題。
測(cè)試結(jié)果令人驚喜,國(guó)內(nèi)大廠的大模型產(chǎn)品如騰訊元寶、阿里通義、字節(jié)豆包、百度文心一言,以及專注于數(shù)學(xué)的大模型九章都給出了正確答案。然而,幾款創(chuàng)業(yè)公司的大模型產(chǎn)品,包括百小應(yīng)、智譜清言、Kimi和萬(wàn)知,卻都認(rèn)為“9.11大于9.9”,這顯然是一個(gè)錯(cuò)誤的答案。
據(jù)ITBEAR科技資訊了解,在這次測(cè)試中,國(guó)內(nèi)大廠的大模型表現(xiàn)優(yōu)異,完勝了創(chuàng)業(yè)公司的大模型,甚至也超過(guò)了國(guó)外的三大旗艦?zāi)P汀_@無(wú)疑顯示了國(guó)內(nèi)大廠在人工智能領(lǐng)域的深厚實(shí)力和出色表現(xiàn)。
具體來(lái)看,Kimi、智譜清言、百小應(yīng)和萬(wàn)知在回答這道題目時(shí)都出現(xiàn)了錯(cuò)誤。而九章大模型、文心一言、通義、元寶和豆包則都給出了正確的答案,并且分析過(guò)程也十分準(zhǔn)確。這一結(jié)果無(wú)疑證明了國(guó)內(nèi)大廠在AI技術(shù)方面的領(lǐng)先地位和出色實(shí)力。