【ITBEAR科技資訊】2月17日,OpenAI正式發(fā)布了其首個(gè)文本生成視頻模型——Sora,并對(duì)外展示了一系列令人驚艷的演示視頻。
OpenAI在官方網(wǎng)站上表示:“Sora是一個(gè)強(qiáng)大的AI模型,它能夠根據(jù)文本指令創(chuàng)建出現(xiàn)實(shí)且充滿想象力的場(chǎng)景。”該公司進(jìn)一步解釋道:“我們正在努力教授人工智能理解和模擬運(yùn)動(dòng)中的物理世界,目標(biāo)是訓(xùn)練出能夠幫助人們解決現(xiàn)實(shí)世界交互問(wèn)題的模型。現(xiàn)在,我們隆重推出Sora,這款強(qiáng)大的文本轉(zhuǎn)視頻模型。它能夠生成長(zhǎng)達(dá)一分鐘的視頻,同時(shí)保證高質(zhì)量的視覺(jué)效果并嚴(yán)格遵循用戶的指示。”
OpenAI強(qiáng)調(diào),所有展示的視頻均是由Sora直接生成,未經(jīng)任何后期修改。為了證明這一點(diǎn),他們展示了一段由Sora生成的視頻,內(nèi)容是一位時(shí)尚女性在霓虹燈和城市標(biāo)牌的映襯下走在東京的街道上。
在這段視頻中,女性角色身著黑色皮夾克、紅色長(zhǎng)裙和黑色靴子,手持黑色錢包,戴著太陽(yáng)鏡,涂著鮮艷的紅色口紅。她行走間流露出自信和隨意的氣質(zhì)。街道濕漉漉的,反射著彩色的燈光,形成鏡面效果。背景中,行人絡(luò)繹不絕。
最令人驚嘆的是視頻后半段的面部細(xì)節(jié)。這位時(shí)尚女性的面部毛孔和瑕疵清晰可見(jiàn),其質(zhì)量令人嘆為觀止。這充分展示了Sora模型在生成高質(zhì)量視頻方面的強(qiáng)大能力。
據(jù)ITBEAR科技資訊了解,Sora的發(fā)布為文本生成視頻領(lǐng)域帶來(lái)了新的突破。它不僅能夠根據(jù)文本指令生成出具有現(xiàn)實(shí)感的場(chǎng)景,還能在細(xì)節(jié)處理上達(dá)到令人難以置信的水平。這一技術(shù)的發(fā)展將為視頻制作、廣告、游戲等領(lǐng)域帶來(lái)革命性的變革。