在AI領(lǐng)域的一次重大突破中,由知名學(xué)者李飛飛共同創(chuàng)立并領(lǐng)導(dǎo)的AI初創(chuàng)企業(yè)World Labs,近期揭開了其首個創(chuàng)新成果的神秘面紗——一個能夠僅憑單張圖片就生成可交互3D世界的模型。這一消息迅速引起了業(yè)界的廣泛關(guān)注。
World Labs的這項新技術(shù),實現(xiàn)了從2D圖片到3D世界的跨越性轉(zhuǎn)變。與傳統(tǒng)的圖片轉(zhuǎn)3D產(chǎn)品相比,該模型生成的3D場景不僅高度還原了原始圖片的風(fēng)格,更賦予了用戶前所未有的互動體驗。用戶可以在瀏覽器中實時與這些場景進行交互,仿佛置身于一個開放世界的游戲中,通過鍵盤和鼠標自由移動、轉(zhuǎn)換視角,甚至模擬相機的對焦和變焦功能。
World Labs的3D世界生成模型不僅提升了用戶體驗,更在技術(shù)上實現(xiàn)了三大突破:連續(xù)性、實時控制和正確的幾何結(jié)構(gòu)。這意味著用戶可以在不改變已生成場景的前提下,自由探索、觀察每一個細節(jié),同時享受真實的物理規(guī)律和立體感帶來的視覺盛宴。用戶還可以為這些場景添加交互效果和動畫,如聲納、聚光燈和波紋動態(tài)效果,使場景更加生動有趣。
World Labs的團隊表示,這項技術(shù)有望徹底改變電影、游戲、模擬器等數(shù)字媒體的制作方式。他們展示了兩個令人驚嘆的應(yīng)用案例:一是將梵高等世界名畫轉(zhuǎn)化為可交互的3D世界,讓用戶能夠身臨其境地欣賞藝術(shù)之美;二是將這項技術(shù)與其他AI工具結(jié)合使用,加速內(nèi)容創(chuàng)作過程。例如,用戶可以先使用文本生成圖像模型創(chuàng)建圖像,再基于這些圖像生成3D世界,從而快速制作出風(fēng)格各異的作品。
盡管這項技術(shù)還處于早期階段,存在一些限制,如生成的3D場景可探索區(qū)域有限,以及偶爾會出現(xiàn)渲染錯誤等,但World Labs的團隊正在不斷努力改進和完善。他們表示,將致力于提高生成世界的大小和擬真度,同時探索更多用戶與場景交互的新方式。
World Labs于今年9月正式宣告成立,是一家專注于空間智能的AI公司。其聯(lián)合創(chuàng)始人兼CEO李飛飛,前谷歌云AI負責(zé)人、斯坦福大學(xué)教授,憑借其深厚的學(xué)術(shù)背景和豐富的行業(yè)經(jīng)驗,帶領(lǐng)團隊致力于構(gòu)建大型世界模型(LWM),以感知、生成并交互3D世界。成立不到一周,World Labs就獲得了超過10億美元的估值,并籌集了2.3億美元的風(fēng)投資金,投資方包括多家知名風(fēng)投機構(gòu)和知名企業(yè)。
World Labs的成立和技術(shù)的突破,標志著生成式AI正邁向一個新的階段——空間智能。隨著技術(shù)的不斷進步和應(yīng)用場景的拓展,我們有理由相信,未來的AI將更加智能、更加人性化,為人類的生活和工作帶來更多的便利和驚喜。