【ITBEAR】近日,蘋果公司內部研究團隊對20個頂尖AI模型進行了一項有趣的測試,結果令人大跌眼鏡。在面對包含干擾信息的簡單算術問題時,這些AI的表現竟不如小學生。
測試中,蘋果團隊使用了這樣一個問題:Oliver在連續三天的采摘活動中,分別摘取了不同數量的獼猴桃。星期五他摘了44個,星期六摘了58個,而星期日的采摘數量是星期五的兩倍。但在這其中,有5個獼猴桃的個頭明顯偏小。題目要求計算出Oliver這三天總共摘了多少個獼猴桃。
令人驚訝的是,盡管正確答案應為190個,但大多數AI模型給出的答案卻是185個。顯然,它們在處理問題時受到了“5個獼猴桃個頭偏小”這一干擾信息的影響,錯誤地將這一信息與總數計算關聯了起來。
蘋果團隊的研究發現,當問題中包含有誤導性的信息時,AI模型的表現會顯著下降。這表明,這些模型在處理問題時更多地是依賴于訓練數據中的語言模式,而非真正理解了數學概念或問題的本質。
這一發現引發了人們對AI智能程度的重新思考。盡管AI在某些領域取得了顯著的進展,但這次測試卻揭示出它們在處理復雜或含混信息時的局限性。這也提醒我們,在依賴AI技術時,需要更加謹慎地評估其性能和可靠性。
蘋果團隊的研究并非旨在貶低AI的價值,而是希望為AI的發展提供更為理性的視角。他們指出,單純地增加數據量或提升計算能力,并不能從根本上解決AI在處理這類問題時的困境。未來,我們需要在AI的訓練方法和算法設計上尋求更多的突破和創新。