【ITBEAR】9月23日消息,阿里巴巴的研究團(tuán)隊(duì)近日公布了一項(xiàng)令人矚目的研究成果:他們成功開發(fā)出一個(gè)基于大模型的VARP智能體框架,該框架能讓AI以視覺方式理解并操作游戲,且在《黑神話·悟空》中展現(xiàn)出了超越人類玩家的實(shí)力。
據(jù)ITBEAR了解,這項(xiàng)研究的核心在于VARP框架的獨(dú)特設(shè)計(jì)。它不同于傳統(tǒng)的強(qiáng)化學(xué)習(xí)方法,而是直接將游戲截圖作為輸入,通過視覺語言模型進(jìn)行推理,生成Python代碼形式的動(dòng)作指令來操作游戲。這種方法的創(chuàng)新之處在于,它顯著減少了所需的數(shù)據(jù)量,僅依靠1000條有效數(shù)據(jù)就實(shí)現(xiàn)了令人印象深刻的游戲操作水平。
在研究過程中,阿里巴巴的團(tuán)隊(duì)定義了12個(gè)與《黑神話·悟空》相關(guān)的任務(wù),其中75%與戰(zhàn)斗有關(guān)。他們構(gòu)建了一個(gè)包含鍵鼠操作和游戲截圖的人類操作數(shù)據(jù)集,并以此為基礎(chǔ)訓(xùn)練了VARP智能體。該智能體在90%的簡(jiǎn)單和中等水平戰(zhàn)斗場(chǎng)景中取得了勝利,甚至在面對(duì)某些精英怪時(shí),其勝率已經(jīng)超過了人類玩家。
值得一提的是,VARP框架還包含了三個(gè)庫:情景庫、動(dòng)作庫和人工引導(dǎo)庫。這些庫存儲(chǔ)了智能體的自我學(xué)習(xí)和人類指導(dǎo)的內(nèi)容,使其能夠進(jìn)行高效的檢索和更新。這種設(shè)計(jì)不僅提升了AI的學(xué)習(xí)效率,還為其在面對(duì)復(fù)雜任務(wù)時(shí)提供了更多的靈活性。
盡管VARP智能體在游戲操作中取得了顯著的成果,但研究團(tuán)隊(duì)也指出了其存在的局限性。例如,由于視覺語言模型的推理速度限制,AI無法實(shí)時(shí)處理每一幀畫面,這可能導(dǎo)致其在某些情況下錯(cuò)過關(guān)鍵信息。此外,在沒有人類引導(dǎo)的情況下,智能體可能無法自行找到正確的游戲路線。
阿里巴巴的這項(xiàng)研究無疑為AI在游戲領(lǐng)域的應(yīng)用開辟了新的道路。它不僅展示了AI在理解和操作復(fù)雜游戲方面的巨大潛力,還為未來的游戲開發(fā)和AI技術(shù)研究提供了有價(jià)值的參考。
#阿里巴巴# #VARP智能體# #AI游戲操作# #黑神話悟空# #視覺語言模型#