(ChinaZ.com)12月5日 消息:12月1日,YouTube博主“Code Bullet”發(fā)布了一段視頻,題為“AI學(xué)習(xí)玩合成大西瓜游戲”,截至目前,該視頻已經(jīng)吸引了105萬(wàn)次觀看和9.6萬(wàn)次點(diǎn)贊。
視頻中,他首先用編程語(yǔ)言模擬了游戲規(guī)則,令兩個(gè)櫻桃合成一個(gè)草莓,兩個(gè)草莓可以進(jìn)一步合成葡萄,直至最終形成一個(gè)大西瓜。不僅如此,AI在面對(duì)三顆相同水果時(shí),不同尋常地選擇將它們?nèi)亢喜ⅲl(fā)了“水果大爆炸”,一舉獲得了250萬(wàn)的高分,遠(yuǎn)超“Code Bullet”最初設(shè)定的3000分目標(biāo)。
在視頻的后半部分,博主讓196個(gè)AI同時(shí)參與游戲,放置不同數(shù)量的水果。結(jié)果顯示,當(dāng)水果數(shù)量達(dá)到150個(gè)時(shí),一些AI開(kāi)始失敗。通過(guò)對(duì)獲勝和失敗的AI表現(xiàn)進(jìn)行分析,他總結(jié)出了《合成大西瓜》的一些游戲攻略,強(qiáng)調(diào)獲勝AI通常會(huì)將得分更高的水果放在角落位置。這一發(fā)現(xiàn)引發(fā)了觀眾的廣泛討論,對(duì)游戲AI研究產(chǎn)生了濃厚興趣。
然而,評(píng)論區(qū)的一些網(wǎng)友指出,雖然AI在游戲中表現(xiàn)優(yōu)異,但其過(guò)程未考慮實(shí)際游戲特殊情況,例如不同水果的重量和隨機(jī)掉落位置。這一提醒使人們意識(shí)到,盡管AI在模擬環(huán)境中表現(xiàn)出色,但在真實(shí)場(chǎng)景中仍存在局限性。
此外,“Code Bullet”以《合成大西瓜》為例,突顯了通過(guò)游戲場(chǎng)景訓(xùn)練AI的潛在益處。他之前還通過(guò)訓(xùn)練AI玩神奇寶貝和模擬斯坦福小鎮(zhèn)等場(chǎng)景,揭示了Generative Agents在游戲領(lǐng)域的廣闊可能性。這種通過(guò)試錯(cuò)學(xué)習(xí)的方法對(duì)于引導(dǎo)AI實(shí)現(xiàn)特定目標(biāo)至關(guān)重要。