【ITBEAR】在AI技術日新月異的今天,Anthropic公司的Claude 3.5再次展示了其強大的能力。近日,賓夕法尼亞大學沃頓商學院的Ethan Mollick教授對Claude 3.5進行了一系列游戲測試,探索其在非傳統任務上的表現。
在「Paperclip Clicker」游戲中,Claude 3.5展現出了令人驚訝的策略制定能力。它不僅能迅速理解游戲規則,還能制定出長期策略,并根據游戲進展進行調整。這一過程中,Claude 3.5的前瞻性思維和洞察力得到了充分展現。
然而,Claude 3.5在游戲中也暴露出了一些短板。盡管它能制定出明智的策略,但在執行過程中也會犯一些低級錯誤,如計算錯誤導致策略失效。在嘗試自動化游戲時,Claude 3.5的編碼能力也顯得不足。
在另一款游戲Magic the Gathering Arena的測試中,Claude 3.5的表現同樣不盡如人意。盡管它在卡牌選擇和調度方面表現出色,但在法力值計算和操作連貫性方面仍存在問題。
盡管存在這些問題,但Claude 3.5在游戲測試中的表現仍然令人印象深刻。它能夠為游戲制定長期策略,并堅持執行和改進,這是許多其他AI系統所無法比擬的。同時,這次測試也揭示了與AI智能體合作時需要采用的新方法。
Mollick教授指出,隨著AI技術的不斷發展,我們需要重新審視與AI的交互方式。AI正在突破聊天框的限制,進入我們的世界,這將為人機交互帶來全新的挑戰和機遇。
這次測試不僅展示了Claude 3.5的強大能力,也揭示了AI在復雜任務中的潛在問題。隨著AI技術的不斷進步,我們有理由相信,未來的AI系統將在更多領域展現出更加出色的表現。