【ITBEAR科技資訊】6月25日消息,近日,隨著各省2024年高考成績陸續(xù)揭曉,學(xué)霸們的成績成為熱議焦點(diǎn)。與此同時(shí),一場別開生面的“AI高考”也吸引了廣泛關(guān)注。據(jù)悉,有媒體組織了一場AI大模型的高考模擬測試,旨在評(píng)估這些模型在解答高考試題時(shí)的表現(xiàn)。
最新發(fā)布的高考新課標(biāo)Ⅰ卷大模型評(píng)測報(bào)告顯示,GPT-4o在文科總分中拔得頭籌,獲得了562分的高分。而在國內(nèi)產(chǎn)品中,字節(jié)跳動(dòng)旗下的豆包緊隨其后,取得了542.5分的優(yōu)異成績。據(jù)ITBEAR科技資訊了解,本次大模型高考評(píng)測完全采用河南省的高考試卷,河南高考文科本科一批錄取分?jǐn)?shù)線為521分,豆包等三款國產(chǎn)AI成功突破一本線,展現(xiàn)了出色的能力。
在文科領(lǐng)域,特別是語文和英語考試中,AI大模型展現(xiàn)出了與人類考生相媲美的水平。國產(chǎn)大模型憑借對(duì)中文語言的深入理解,在語文考試中表現(xiàn)出色,百小應(yīng)、字節(jié)豆包和騰訊元寶等模型在語文考試中名列前茅。而在英語考試中,大模型在閱讀、語言運(yùn)用等客觀題方面取得了較高的分?jǐn)?shù),甚至有的模型獲得了滿分。然而,在寫作部分,AI大模型的表現(xiàn)尚待提高,最高分僅為29分。
然而,在理科方面,AI大模型的表現(xiàn)則顯得較為薄弱。大模型的理科最高分尚未達(dá)到480分,多數(shù)模型的理科總分在400分以下。特別是在數(shù)學(xué)、化學(xué)和物理等科目中,AI大模型的表現(xiàn)與人類頂尖考生存在較大差距。數(shù)學(xué)考試中,僅有GPT-4o、文心一言4.0和豆包等少數(shù)模型獲得了60分以上的成績。化學(xué)和物理的平均分?jǐn)?shù)更是低至34分和39分,顯示出AI大模型在理科領(lǐng)域的不足。
這場“AI高考”不僅為我們展示了AI大模型在高考模擬測試中的表現(xiàn),也揭示了AI在教育領(lǐng)域的應(yīng)用潛力和挑戰(zhàn)。隨著技術(shù)的不斷進(jìn)步,AI在教育領(lǐng)域的應(yīng)用將更加廣泛,為人類的教育事業(yè)帶來更多可能性。