(ChinaZ.com)12月5日 消息:12月1日,YouTube博主“Code Bullet”發(fā)布了一段視頻,題為“AI學(xué)習(xí)玩合成大西瓜游戲”,截至目前,該視頻已經(jīng)吸引了105萬次觀看和9.6萬次點(diǎn)贊。
視頻中,他首先用編程語言模擬了游戲規(guī)則,令兩個櫻桃合成一個草莓,兩個草莓可以進(jìn)一步合成葡萄,直至最終形成一個大西瓜。不僅如此,AI在面對三顆相同水果時,不同尋常地選擇將它們?nèi)亢喜?,引發(fā)了“水果大爆炸”,一舉獲得了250萬的高分,遠(yuǎn)超“Code Bullet”最初設(shè)定的3000分目標(biāo)。
在視頻的后半部分,博主讓196個AI同時參與游戲,放置不同數(shù)量的水果。結(jié)果顯示,當(dāng)水果數(shù)量達(dá)到150個時,一些AI開始失敗。通過對獲勝和失敗的AI表現(xiàn)進(jìn)行分析,他總結(jié)出了《合成大西瓜》的一些游戲攻略,強(qiáng)調(diào)獲勝AI通常會將得分更高的水果放在角落位置。這一發(fā)現(xiàn)引發(fā)了觀眾的廣泛討論,對游戲AI研究產(chǎn)生了濃厚興趣。
然而,評論區(qū)的一些網(wǎng)友指出,雖然AI在游戲中表現(xiàn)優(yōu)異,但其過程未考慮實(shí)際游戲特殊情況,例如不同水果的重量和隨機(jī)掉落位置。這一提醒使人們意識到,盡管AI在模擬環(huán)境中表現(xiàn)出色,但在真實(shí)場景中仍存在局限性。
此外,“Code Bullet”以《合成大西瓜》為例,突顯了通過游戲場景訓(xùn)練AI的潛在益處。他之前還通過訓(xùn)練AI玩神奇寶貝和模擬斯坦福小鎮(zhèn)等場景,揭示了Generative Agents在游戲領(lǐng)域的廣闊可能性。這種通過試錯學(xué)習(xí)的方法對于引導(dǎo)AI實(shí)現(xiàn)特定目標(biāo)至關(guān)重要。