近期,DeepMind,谷歌的人工智能研究部門,揭曉了其最新研發(fā)成果——Genie 2模型。這款創(chuàng)新模型能夠根據(jù)用戶提交的單張圖片與文字說明,即時(shí)創(chuàng)造出可互動(dòng)的3D游戲空間。想象一下,用戶只需輸入“森林中可愛的機(jī)器人伙伴”,Genie 2便能迅速構(gòu)建一個(gè)生動(dòng)且可供探索的虛擬世界。
作為Genie模型的進(jìn)階版本,Genie 2在功能與性能上實(shí)現(xiàn)了質(zhì)的飛躍。它不僅能生成720p高清分辨率的3D環(huán)境,還支持用戶自由選擇第一人稱或第三人稱視角進(jìn)行體驗(yàn)。更令人驚嘆的是,Genie 2還具備模擬基礎(chǔ)物理現(xiàn)象的能力,如重力、碰撞及水體流動(dòng),同時(shí)處理復(fù)雜的光影效果、反射及煙霧,甚至能創(chuàng)造互動(dòng)的NPC(非玩家角色),極大地增強(qiáng)了虛擬世界的真實(shí)感。
Genie 2的空間記憶功能是其一大亮點(diǎn)。在虛擬探索過程中,即便某些區(qū)域暫時(shí)離開視線,系統(tǒng)也能保持這些區(qū)域的一致性,確保用戶體驗(yàn)的連貫性。盡管目前Genie 2創(chuàng)建的游戲在趣味性上仍有局限,且每隔約一分鐘會(huì)重置進(jìn)度,但DeepMind將其定位為科研與創(chuàng)意的得力助手,尤其適用于快速原型設(shè)計(jì)、AI智能體評(píng)估等場景。