在科技日新月異的今天,人類探索未知的腳步從未停歇。曾幾何時,阿姆斯特朗那句“這是個人的一小步,卻是人類的一大步”成為歷史性時刻的注腳。而今,在人工智能領(lǐng)域,智譜科技的AutoGLM正以其獨特的方式,書寫著新時代的篇章。
11月末,智譜Agent OpenDay活動上,三款新品驚艷亮相:AutoGLM Web瀏覽器插件、GLM-PC電腦智能體大模型,以及備受矚目的AutoGLM——智譜首個產(chǎn)品化的智能體Agent。短短一月間,AutoGLM的能力實現(xiàn)了質(zhì)的飛躍,不僅限于簡單的點外賣、朋友圈互動,更在多個方面取得了突破性進(jìn)展。
AutoGLM現(xiàn)已能夠自主執(zhí)行超過50步的長流程任務(wù),還能輕松跨越不同App完成復(fù)雜指令。它為用戶開啟了“全自動”上網(wǎng)新紀(jì)元,支持多個主流網(wǎng)站的無人駕駛操作。而GLM-PC,這款基于視覺多模態(tài)模型的通用Agent,更是實現(xiàn)了人機(jī)交互的新探索,用戶只需設(shè)定好任務(wù),GLM-PC便能如臂使指般完成。
或許有人會問,AutoGLM究竟是何方神圣?簡而言之,它就像是手機(jī)的AI遙控器,用戶只需一句話,AutoGLM便能模擬人類操作手機(jī)完成任務(wù)。從對話機(jī)器人到擁有“手、腦、眼”的自主Agent,AI的進(jìn)化令人嘆為觀止。在實際測試中,AutoGLM無論是查找出行攻略、評論博主內(nèi)容,還是購買水果、預(yù)訂機(jī)票,都表現(xiàn)得游刃有余。當(dāng)然,面對彈窗或需要人工確認(rèn)的環(huán)節(jié),AutoGLM還需用戶的協(xié)助。
AutoGLM的升級不僅體現(xiàn)在任務(wù)執(zhí)行上,更在于其對人機(jī)交互模式的深刻影響。過去,人們需要學(xué)習(xí)如何操作電腦、適應(yīng)復(fù)雜的應(yīng)用界面,而今,AI正逐漸打破這一僵局。用戶只需用自然語言發(fā)出指令,AI便能自動處理復(fù)雜任務(wù),人機(jī)協(xié)作的門檻大大降低。這種變化,不僅體現(xiàn)在AutoGLM上,蘋果的Apple Intelligence、Anthropic的Computer Use、谷歌的Jarvis以及OpenAI即將發(fā)布的Operator,都在朝著這一方向努力。
在智譜Agent OpenDay上,榮耀、華碩、小鵬、高通、英特爾等企業(yè)紛紛分享了他們對智能終端的實踐及展望。這表明,大模型重塑人機(jī)交互范式,已成為產(chǎn)業(yè)上下游的共識。隨著AutoGLM能力的不斷提升,它將能調(diào)用更多應(yīng)用、適配更多系統(tǒng),實現(xiàn)更加復(fù)雜、連貫的自主操作。
AutoGLM Web和GLM-PC同樣表現(xiàn)出色。前者能理解用戶指令,在網(wǎng)頁上自動檢索、總結(jié)多鏈接,甚至生成個性化內(nèi)容;后者則能遠(yuǎn)程操控電腦,設(shè)定未來時間執(zhí)行任務(wù),讓用戶在工作與休息間自由切換。
值得注意的是,端側(cè)算力的持續(xù)提升為AI的普及提供了有力支持。智譜推出的為AI原生設(shè)備適配的模型和端云同源的協(xié)同架構(gòu),意味著Agent不僅能在應(yīng)用層面帶來用戶體驗的變革,還能廣泛推廣至各類智能設(shè)備上。手機(jī)+AI、PC+AI、汽車+AI等新型智能設(shè)備將不斷涌現(xiàn),為用戶帶來前所未有的便捷體驗。
大模型正逐步成為新時代的“操作系統(tǒng)”,以AutoGLM為代表的Agentic AI正引領(lǐng)著人機(jī)交互的新潮流。未來,我們或許將不再需要學(xué)習(xí)如何操作各種設(shè)備,而是直接通過自然語言與它們交流。這一變革將深刻影響我們的生活方式和工作模式,開啟一個全新的智能時代。