【ITBEAR科技資訊】6月25日消息,近日,隨著各省2024年高考成績(jī)陸續(xù)揭曉,學(xué)霸們的成績(jī)成為熱議焦點(diǎn)。與此同時(shí),一場(chǎng)別開(kāi)生面的“AI高考”也吸引了廣泛關(guān)注。據(jù)悉,有媒體組織了一場(chǎng)AI大模型的高考模擬測(cè)試,旨在評(píng)估這些模型在解答高考試題時(shí)的表現(xiàn)。
最新發(fā)布的高考新課標(biāo)Ⅰ卷大模型評(píng)測(cè)報(bào)告顯示,GPT-4o在文科總分中拔得頭籌,獲得了562分的高分。而在國(guó)內(nèi)產(chǎn)品中,字節(jié)跳動(dòng)旗下的豆包緊隨其后,取得了542.5分的優(yōu)異成績(jī)。據(jù)ITBEAR科技資訊了解,本次大模型高考評(píng)測(cè)完全采用河南省的高考試卷,河南高考文科本科一批錄取分?jǐn)?shù)線為521分,豆包等三款國(guó)產(chǎn)AI成功突破一本線,展現(xiàn)了出色的能力。
在文科領(lǐng)域,特別是語(yǔ)文和英語(yǔ)考試中,AI大模型展現(xiàn)出了與人類(lèi)考生相媲美的水平。國(guó)產(chǎn)大模型憑借對(duì)中文語(yǔ)言的深入理解,在語(yǔ)文考試中表現(xiàn)出色,百小應(yīng)、字節(jié)豆包和騰訊元寶等模型在語(yǔ)文考試中名列前茅。而在英語(yǔ)考試中,大模型在閱讀、語(yǔ)言運(yùn)用等客觀題方面取得了較高的分?jǐn)?shù),甚至有的模型獲得了滿(mǎn)分。然而,在寫(xiě)作部分,AI大模型的表現(xiàn)尚待提高,最高分僅為29分。
然而,在理科方面,AI大模型的表現(xiàn)則顯得較為薄弱。大模型的理科最高分尚未達(dá)到480分,多數(shù)模型的理科總分在400分以下。特別是在數(shù)學(xué)、化學(xué)和物理等科目中,AI大模型的表現(xiàn)與人類(lèi)頂尖考生存在較大差距。數(shù)學(xué)考試中,僅有GPT-4o、文心一言4.0和豆包等少數(shù)模型獲得了60分以上的成績(jī)。化學(xué)和物理的平均分?jǐn)?shù)更是低至34分和39分,顯示出AI大模型在理科領(lǐng)域的不足。
這場(chǎng)“AI高考”不僅為我們展示了AI大模型在高考模擬測(cè)試中的表現(xiàn),也揭示了AI在教育領(lǐng)域的應(yīng)用潛力和挑戰(zhàn)。隨著技術(shù)的不斷進(jìn)步,AI在教育領(lǐng)域的應(yīng)用將更加廣泛,為人類(lèi)的教育事業(yè)帶來(lái)更多可能性。