【ITBEAR科技資訊】5月26日消息,近期,一篇關于人工智能的研究論文在《自然-人類行為》期刊上發表,揭示了AI大語言模型在追蹤他人心理狀態能力任務中的驚人表現。據論文第一作者、德國漢堡-埃彭多夫大學醫學中心的James W. A. Strachan及其團隊的研究,兩類AI大語言模型在特定情況下,展現出了與人類相似甚至超越人類的心智理論能力。
心智理論,這一對人類社交互動至關重要的能力,是人們溝通交流和產生共鳴的基石。為了深入探索AI在這方面的能力,研究團隊精心挑選了多項任務,包括發現錯誤想法、理解間接言語以及識別失禮等,以全面測試AI的心智理論水平。
據ITBEAR科技資訊了解,該研究選用了當前熱門的GPT和LLaMA2兩個大語言模型進行實驗,并與1907名人類參與者的表現進行了對比分析。結果令人矚目:GPT模型在識別間接要求、錯誤想法和誤導方面的表現不僅達到了人類的平均水平,甚至在某些情況下超越了人類;而LLaMA2模型雖然整體表現遜于人類,但在識別失禮方面卻展現出了優于人類的能力。
然而,研究團隊也指出,LLaMA2在識別失禮方面的成功并非真正源于對失禮的敏感,而是因為其回答的“偏見程度”相對較低。相比之下,GPT在堅持結論時表現出的“超保守”態度,可能是其在某些任務中表現不佳的原因,而非推理錯誤。