【ITBEAR科技資訊】10月12日消息,近日,國際先進AI協會(AAAI)宣布,由學而思領銜,與谷歌、暨南大學等多家科技企業和高校的專家學者合作,將聯袂舉辦AAA 2024全球大模型數學推理競賽。
這項競賽分為中文數學解題和英文數學解題兩個方向,競賽所需的中英文數據集TAL-SAQ7K-CN和TAL-SAQ6K-EN由學而思提供,據悉,這些數據集包含了來自國內外多個中小學數學競賽的真題。
據ITBEAR科技資訊了解,這次競賽將是全球首個數學大模型解題競賽,主辦方為參賽者提供了三個參考評估基準:GPT-3.5、GPT-4和好未來自研數學大模型MathGPT。
在競賽期間,參賽者需要運用這些大模型來生成數學題目的推理步驟和答案。主辦方將通過比較參賽模型生成的答案與正確答案之間的準確率來排名。主辦方強調,他們期望參賽者使用大型語言模型來解決K-12(指學前教育至高中教育)的數學問題。
據介紹,目前大型語言模型存在一些“天生缺陷”,如缺乏復雜推理能力和數值計算的不準確性。如果這些模型能夠克服這些問題,成功應對數學推理的挑戰,那么AI領域將迎來一個全新的時代。
競賽日程如下:
- 2023年10月10日:競賽開始
- 2023年12月31日:最終提交截止日期
- 2024年1月10日:公布最終競賽結果
獎項設置如下:
兩個方向的前三名將獲得現金獎勵,一等獎1000美元,二等獎600美元,三等獎300美元。
此外,兩個方向的前三名還將獲得正式證書,并受邀在2024年AAAI國際大會期間發表口頭報告。此次競賽的前三名團隊的第一作者還將被邀請撰寫競賽綜述論文。