在科技界的一次重大突破中,AI領(lǐng)域的重量級(jí)人物李飛飛創(chuàng)立的World Labs震撼發(fā)布了其首個(gè)核心成果——世界模型,該模型能夠從單張圖像中生成完整的3D世界。
這一消息迅速在行業(yè)內(nèi)引發(fā)了轟動(dòng),李飛飛也迅速在社交媒體上分享了這一喜訊。她所展示的,是一個(gè)前所未有的AI新紀(jì)元,即從2D內(nèi)容生成邁向3D世界創(chuàng)造的飛躍。
目前,市面上的大多數(shù)AI工具仍局限于制作圖像或視頻等2D內(nèi)容,這些工具在內(nèi)容的控制和一致性方面存在顯著缺陷。而World Labs的3D生成技術(shù),則顯著提升了內(nèi)容的可控性和一致性。其模型能夠預(yù)測3D幾何形狀,并填充場景中不可見的部分,這將徹底改變電影、游戲、模擬器及其他數(shù)字表現(xiàn)形式的制作方式。
World Labs的技術(shù)允許用戶通過輸入任意一張圖片,即可生成一個(gè)完整的3D世界。用戶可以通過鍵盤上的WASD鍵控制視角的上下左右移動(dòng),還可以通過鼠標(biāo)拖動(dòng)探索這個(gè)世界的每一個(gè)角落。這種體驗(yàn),不僅僅是視覺上的震撼,更是互動(dòng)性的全面升級(jí)。
除了基本的視角控制外,World Labs還提供了多種玩法。例如,用戶可以使用虛擬攝像機(jī)進(jìn)行實(shí)時(shí)渲染,通過精確控制攝像機(jī)的各項(xiàng)參數(shù),實(shí)現(xiàn)各種藝術(shù)攝影效果,如淺景深效果、推移變焦效果等。這些效果不僅增強(qiáng)了畫面的層次感,還創(chuàng)造了獨(dú)特的視覺沖擊力和動(dòng)態(tài)感。
在3D效果方面,World Labs的生成模型不僅僅局限于像素層面的預(yù)測。其優(yōu)勢在于生成的3D場景具有持久的現(xiàn)實(shí)性、實(shí)時(shí)控制性和符合物理規(guī)則的特點(diǎn)。一旦生成了一個(gè)世界,它就會(huì)一直存在,不會(huì)因視角的改變而發(fā)生變化。用戶可以實(shí)時(shí)移動(dòng)場景,探索細(xì)節(jié),感受真實(shí)世界的堅(jiān)實(shí)感和深度感。通過深度貼圖技術(shù),每個(gè)像素都按其與相機(jī)的距離著色,使得場景更具空間感。
World Labs團(tuán)隊(duì)還展示了他們從梵高、霍珀、修拉和康定斯基等藝術(shù)大師的作品中生成的3D世界。這些作品不僅保留了原作的藝術(shù)風(fēng)格,還通過3D技術(shù)賦予了新的生命和活力。
3D生成技術(shù)還可以與其他AI工具組合使用,如Midjourney、Runway、Suno等。這將極大地改變創(chuàng)作者的工作流程,使他們能夠更高效地創(chuàng)作出具有獨(dú)特風(fēng)格的3D世界。例如,用戶可以先使用文生圖模型生成圖像,然后將其導(dǎo)入World Labs中生成3D世界,從而得到不同風(fēng)格的3D場景。
World Labs的成立,是李飛飛自2018年從谷歌離職重返斯坦福后的首次直接創(chuàng)業(yè)項(xiàng)目。作為一家專注于打造世界模型進(jìn)行3D世界感知、生成和互動(dòng)的AI初創(chuàng)公司,World Labs在短短三個(gè)月內(nèi)就完成了兩輪融資,融資總額超過2.3億美元,估值突破10億美元。投資方包括硅谷知名風(fēng)投a16z和AI基金Radical Ventures。
李飛飛認(rèn)為,未來AI的核心在于“空間智能”,即讓AI具備感知、推理并與3D世界交互的能力。她希望通過World Labs推動(dòng)這一領(lǐng)域的發(fā)展,實(shí)現(xiàn)更高層次的空間智能。World Labs的團(tuán)隊(duì)陣容豪華,除了李飛飛外,還包括實(shí)時(shí)風(fēng)格轉(zhuǎn)換和超分辨率領(lǐng)域的專家賈斯汀·約翰遜、神經(jīng)輻射場(NeRF)的提出者本·米爾登霍爾以及3D重建專家克里斯托夫·拉斯納。
然而,盡管World Labs在技術(shù)研發(fā)和團(tuán)隊(duì)配置上具有顯著優(yōu)勢,但其面臨的挑戰(zhàn)也不容忽視。從技術(shù)角度來看,構(gòu)建一個(gè)高精度的3D世界理解和生成模型需要大量的數(shù)據(jù)和計(jì)算資源,同時(shí)還需要解決實(shí)時(shí)交互的技術(shù)難題。在市場競爭方面,英偉達(dá)、meta等多家公司也在積極布局物理AI與3D世界的相關(guān)技術(shù),使得市場競爭異常激烈。