【ITBEAR】據(jù)最新消息,谷歌正籌備在12月推出其大型動(dòng)作模型“Project Jarvis”。據(jù)悉,這一項(xiàng)目將為用戶在網(wǎng)頁(yè)上執(zhí)行多項(xiàng)日常任務(wù)提供自動(dòng)化支持,如研究收集、產(chǎn)品購(gòu)買及航班預(yù)訂等。
“Jarvis”將由谷歌Gemini的未來(lái)版本驅(qū)動(dòng),并特別針對(duì)Chrome瀏覽器進(jìn)行優(yōu)化。該工具通過(guò)截取屏幕截圖、解析內(nèi)容及自動(dòng)執(zhí)行點(diǎn)擊、輸入等操作,以實(shí)現(xiàn)網(wǎng)頁(yè)任務(wù)的自動(dòng)化。值得注意的是,目前該工具在執(zhí)行操作時(shí)存在數(shù)秒的間隔。
當(dāng)前,各大AI公司均在研發(fā)類似功能的模型,包括微軟的Copilot Vision、蘋果的Apple Intelligence、Anthropic的Claude測(cè)試版及OpenAI的相關(guān)項(xiàng)目。
谷歌計(jì)劃首先向少量測(cè)試者發(fā)布“Jarvis”,以便發(fā)現(xiàn)并修復(fù)潛在的Bug,因此具體展示計(jì)劃可能會(huì)有所調(diào)整。