【ITBEAR】Anthropic公司于近日揭曉了Claude 3.5的重大更新,推出了Claude 3.5 Haiku與Claude 3.5 Sonnet兩款新版本。其中,Claude 3.5 Sonnet在編程及計(jì)算機(jī)操作功能上實(shí)現(xiàn)了顯著提升,新增“computer use”功能,使其能夠模擬人類操作計(jì)算機(jī)的行為。
據(jù)悉,Claude 3.5 Sonnet能夠遵循用戶指令,在計(jì)算機(jī)屏幕上移動光標(biāo)、點(diǎn)擊相關(guān)位置,并通過虛擬鍵盤輸入信息。在OSWorld評估中,該功能雖未達(dá)到人類水平,但已遠(yuǎn)超同類AI模型。
Anthropic開發(fā)者關(guān)系主管強(qiáng)調(diào),計(jì)算機(jī)使用功能是全新人機(jī)交互范式的第一步,也是AI模型應(yīng)具備的基礎(chǔ)能力。目前,Claude 3.5 Sonnet及“computer use”測試版均已開放使用。
在智能體編碼和工具使用任務(wù)中,Claude 3.5 Sonnet取得了顯著突破,性能大幅提升,超越了包括OpenAI o1-preview在內(nèi)的所有公開可用模型。
然而,Claude 3.5 Sonnet在操作速度和精確度上仍存在不足,如拖拽、縮放等日常操作尚無法實(shí)現(xiàn),且觀察屏幕的方式可能會錯(cuò)過短暫動作。盡管如此,這一進(jìn)步仍為軟件開發(fā)等任務(wù)帶來了新的可能性。