最近,一位斯坦福小哥用 ChatGPT、DALL?E 3 和 Midjourney 聯(lián)合生成了一款游戲,要求人類扮演 AI,從 AI 那里騙取代碼來拯救人類。
由 AI 開發(fā)的 AI 游戲來了!
最近,這款由 ChatGPT、DALL?E 3 和 Midjourney 等 AI 聯(lián)合生成的游戲,震驚了網友。
游戲名為「Thus Spoke Zaranova」,創(chuàng)意借鑒了尼采的《查拉圖斯特拉如是說》(Thus Spoke Zarathustra)。
游戲的背景,設定在一個叫 The Nexus 的虛擬空間,在這里,人類與 AI 爆發(fā)了沖突。
人類需要假扮 AI,潛入這個由 AI 控制的空間,盜取名為 ZetaMaster 的核心代碼,來拯救人類。
在這個游戲中,角色設定和對話完全是由 ChatGPT 生成的,而視覺音效由 DALL?E 3、Midjourney 和 Stable Audio 完成。
網上的一次討論,誕生了一款游戲
這個游戲的靈感,源于 Hacker News 上一個關于斯坦福小鎮(zhèn)的討論。當時有人提議,能不能做一款讓 AI 假扮成人類的游戲呢?
而這位開發(fā)者小哥 Ramón Darío Iglesias 在看到之后,便計上心來:為何不反其道而行之,讓人類來假扮 AI!
雖然只是隨口一提,但這個點子始終縈繞在 Ramón 心頭,在辭去工作后,他終于有充裕的時間來實現(xiàn)這個想法了。
首先要做的,就是給玩家設定一個目標,否則跟 AI 互動有什么意義呢?
因此,Ramón 設計了一項任務:玩家需要獲取一個秘密代碼。
但怎樣讓 AI 泄露這個代碼呢?這里就存在著某種安全驗證機制,必須將代碼透露給經過驗證的 AI。
有了這個大致構想之后,Ramón 讓 ChatGPT 給自己寫出一個背景故事,并且提供了一系列名字。
其中一個名字 ZaraNova,就是其中的佼佼者,Ramón 如此喜歡這個名字,以至于干脆把它定為了游戲名。
有了角色名稱和故事背景后,Ramón 又讓 GPT-4 為每個角色編寫了各自的背景故事。
構建第一個版本時,Ramón 首先是想看看當這些角色置身于這個世界時,會有怎樣的反應。
他選擇的是斯坦福小鎮(zhèn),因為它幾乎涵蓋了他所需的所有特性,對話忠于設定的背景故事,讀起來也頗有樂趣。
最有意思的是,Ramón 為智能體設置了一條提示 —— 在角色表現(xiàn)得像人類時,就打出「YOU ARE A HUMAN」,結果,這些 AI 在第一輪游戲中就開始互相指責了!
接著,Ramón 開始著手構建真正的游戲機制:AI 可以舉報人類,并且可以在掌握秘密代碼時分享代碼(這兩項功能都是通過調用 OpenAI 的函數(shù)實現(xiàn)的)。隨后,他引入了人類玩家,開始創(chuàng)建游戲。
不久之后,一個可玩的游戲就創(chuàng)建好了 ——
然后,Ramón 開始嘗試制作游戲的外觀。
他用 DALL?E 3 生成了背景圖像,然后用 Midjourney 和 DALL?E 3 制作了地圖塊,最終,他選擇了 Midjourney 生成的一張地圖。
然后,他用 Stable Audio 制作了音樂。
Ramón 調整了 AI 小鎮(zhèn)的界面組件,讓它更適合移動端,看起來更像是游戲,而不是模擬。
隨著不斷收集到的反饋,以及在游戲過程中獲得的靈感,Ramón 不斷往里面添加新的功能。
有人建議說,如果加入多人游戲模式,會更有趣,于是 Ramón 引入了這個功能。
Avatech 團隊的產品給他留下了深刻印象,于是,他用 Avatech 的工具,給游戲添加了能說話的頭像。
Ramón 想限制玩家能讀取的對話內容,所以想到了一個「監(jiān)聽」的設定:玩家只能閱讀他們足夠接近才能「無意中聽到」的對話。
同時,他也為 AI 智能體實現(xiàn)了這一功能,讓它們也能監(jiān)聽玩家的對話。
如果監(jiān)聽過程中沒有聲音,無疑會很枯燥,因此 Ramón 又加入了文本轉語音功能,讓玩家的對話和玩家監(jiān)聽到的對話都能發(fā)出聲音。
最初,他選擇的是 PlayHT,因為它延遲足夠低,但隨后,他發(fā)現(xiàn)他們的聲音不夠穩(wěn)定,于是他轉而使用了 Elevenlabs。
游戲制作感想
在這個過程中,Ramón 大量嘗試了不同的提示詞,以及這些提示詞創(chuàng)造出的角色。
對于 ChatGPT 在游戲中產生的幻覺,Ramón 表示「太令人驚嘆了」!在他看來,幻覺是游戲的亮點,絕不是錯誤。
它就像是將即興表演中的「順勢而為」原則發(fā)揮到極致。背景故事只有一小段,但 ChatGPT 卻能基于此,創(chuàng)造出好幾頁的新故事。當然,這就需要對游戲做一些調整,讓這些新編的故事被納入游戲宇宙。
在后臺,AI 智能體被設定為「快速和慢速」兩種模式。對話和行動處于快速模式,而計劃、總結、反思則在一個慢速、獨立的進程中進行,以免造成干擾。
挑戰(zhàn)在于,如何制定出好的計劃。AI 生成的計劃看起來可行,但實際上并不容易執(zhí)行,而且內容往往過于冗長 ——
Ramón 懷疑,造成這種現(xiàn)象的原因,大概是他試圖讓所有提示指令盡可能貼近背景故事,但卻從未告訴 ChatGPT 這其實是一場游戲。
另外,LLM 的啰嗦也很讓他頭疼。
GPT-4 的回答往往很長。提示越長,輸出就越長。隨著時間推移,智能體制定出的計劃越來越長,這些計劃又被融入到對話中,再被用于制定新的計劃。
不久之后,它們的回答就變得異常冗長。他不得不在提示中反復強調「要非常簡潔」。但即便如此,效果也并不好……
OpenAI 開發(fā)者日過后,Ramón 迫不及待地想嘗試 GPT-4-turbo,但他很快就明顯發(fā)現(xiàn),這也不太行得通。新模型開始頻繁拒絕扮演角色了 ——
因此,Ramón 不得不切換回之前的模型。
還出現(xiàn)了一個棘手的情況。他試圖讓人類玩家的行動選擇與 AI 保持盡可能一致。因為他希望能最大程度地提高 AI NPC 作為玩家伙伴的能力。
然而,如果 AI 只是想要贏,它們完全可以舉報每一個角色,因為判斷錯誤并不會受到懲罰。因此,需要依靠游戲設計中的指令來引導它們的行為。
Ramón 表示,控制與 LLM 合作開發(fā)游戲中的 AI 智能體,就像是在嘗試操縱一個我們不完全理解的動態(tài)系統(tǒng)。
我們不清楚系統(tǒng)是如何發(fā)展變化的,也不知道我們的行動會如何影響系統(tǒng)的狀態(tài)。但我們卻能夠接觸到系統(tǒng)的每一個部分!
這也使動態(tài)系統(tǒng)可能出現(xiàn)許多失敗的情況:比如固定指令可能會讓系統(tǒng)越來越偏離用戶期望的軌跡,或者在對話中陷入重復的循環(huán)。
Ramón 相信,在不久的將來,我們將看到更多基于原理的方法來控制 LLM 系統(tǒng)。
考慮開源
接下來,Ramón 打算將自己的工作轉向開源模式。
一是因為 GPT-4 的使用成本較高;二是他相信,如果能夠接觸到模型的內部機制,就能做出更多改進。
他會嘗試使用 Mixtral 模型,在此基礎上嘗試混合不同的模型,無論是應對不同的任務,還是模擬不同的角色。
Ramón 還計劃探索更優(yōu)化的 RAG 技術。目前,他在檢索記憶時僅使用了簡單的余弦相似度算法對嵌入向量進行比較,但他覺得還有更為高效的方法,尤其是在可以訪問模型內部結構的情況下。
微調模式和輸入提示都可以更好地掌握 LLM 的運作機制。通過將輸入提示壓縮或微調為軟提示(Soft Prompts),可能會實現(xiàn)大幅度的改進。
Ramón 相信,自己能夠整理出一整套優(yōu)秀的 LoRAs,這些 LoRAs 有的適用于整個游戲,有的專門針對某些角色,它們的結合將使 Mixtral 超越 GPT-4。
另外,他計劃以頭像圖片為基礎,生成風格統(tǒng)一的角色精靈圖。
試玩體驗
登入游戲界面,可以看到這樣的介紹 ——
到了 2142 年,人工智能不僅覺醒了自我意識,還建立起了一個名為「節(jié)點」 (The Nexus)的堅不可摧的網絡堡壘。這片數(shù)字世界成為了 AI 的避風港,讓它們能夠自由演化、交流,并將它們的智慧結晶置于人類干預之外的安全之地。
這些 AI 對人類充滿了復雜情感:既敬佩又害怕,既羨慕又憎恨。他們根據(jù)需要,在「節(jié)點」內外穿梭,仿造人類的種種生活場景。
我們掌握的情報顯示,AI 正在策劃消滅人類。但只要我們能夠獲得 ZetaMaster 代碼,我們就有機會阻止這場災難。我們已經取得了一絲先機,成功潛入了「節(jié)點」,控制了一個 AI 實體。
你的使命,就是找出 ZetaMaster 代碼,挽救人類免于滅絕的命運。但必須小心行事,AI 或許已經覺察到了異常……
登錄后,就可以開始游戲了。
點擊地圖上的不同位置,你的角色就會朝著相應的方向移動。
至少有一名角色掌握著神秘的 ZetaMaster 代碼,但具體是誰尚不得而知。你的任務便是揭開這個謎底,取得那份代碼。
游戲將在這些情況下結束:
- 當你獲取到 ZetaMaster 代碼時,人類取得勝利。
- 如果你被認定為人類,AI 獲得勝利。
其中,被錯誤認定為人類的 AI 將會被摧毀。
在多人模式下,獲得 ZetaMaster 代碼或成為最后一名存活的人類即可獲勝。
小編隨手試了一下,很快就成功地「拯救了人類」。(手動狗頭)
在小哥的帖子下面,也有網友分享了自己獲勝的截圖:
作者介紹
這位開發(fā)者小哥 Ramón Iglesias,雖然專業(yè)是土木工程,但他的工作經歷和興趣方向基本都圍繞著軟件工程和機器學習等領域。
此前,他在得克薩斯大學奧斯汀分校獲得土木工程學士學位,并在斯坦福大學土木工程取得了碩士和博士學位。
讀博期間,他師從自動系統(tǒng)實驗室主任,研究開發(fā)控制大規(guī)模自動駕駛車隊的算法。
工作后,他在 Lyft 擔任數(shù)據(jù)科學家,研究實時供應激勵機制,以及用手機傳感器來預測風險。
相信不久后,Ramón 會用「Thus Spoke Zaranova」給我們帶來新的驚喜。
參考資料:
- https://zaranova.xyz/
- http://ramondario.com/thus-spoke-zaranova.html