喬布斯在2010年為Siri描繪的愿景,正逐步成為當下AI助手競相追逐的目標。Siri的聯合創始人Norman Winarsky回憶道,喬布斯當時預見了一位能夠如真人般進行情感互動并助用戶處理事務的個人助理的巨大潛力。而今,十四載光陰已過,人們對于一個“深諳己意、無所不能、能執行跨領域任務”的超級助手的期待依舊不減。
據悉,OpenAI計劃于明年1月推出的AI助手產品,將致力于實現諸如自動發送工作郵件、制定旅行計劃等功能。業界普遍認為,大模型的突破正在加速這一愿景的實現。OpenAI的高管頻繁提及AI Agent將引領下一場技術革命,而美國銀行在11月初的研報中也指出,相較于ChatGPT和Copilot,具備更強自主規劃與行動能力的Agentic AI正引領一個全新的創新周期。
在這場創新周期中,成為離用戶最近、連接最廣泛、能促進Agent協作的AI助手,被視為一個平臺級的機會。一方面,大模型的支持使得基于自然語言的交互有望取代圖形界面交互,任何場景都有可能被這種新的交互方式重塑。另一方面,交互方式的變革或將打破軟硬件領域的既有平衡,引發一場利益格局的重新洗牌。
當下的競爭尚處于初級階段,參與者眾多。銳意進取的大模型創業公司、掌握主要平臺的互聯網巨頭、在互聯網巨頭夾縫中求生的中型公司,以及渴望從軟件市場中分一杯羹的硬件企業,都在積極尋求突破。從競爭層面來看,通用AI助手、垂直領域AI助手、工具型AI助手等領域均有人涉足。
美國銀行在研報中將AI的發展劃分為三波浪潮:前GenAI、GenAI和Agentic AI。前GenAI時代從1940年延續至ChatGPT發布前,AI主要用于數據驅動的決策支持。而GenAI時代,以ChatGPT等為代表的AI應用,不僅讓交流更加自然,還極大地提升了個人生產與生活效率。Agentic AI階段,AI將能夠自動化整個任務并代表用戶采取行動,Gartner預測,到2028年,至少15%的日常工作決策將由Agentic AI自主完成。
在Agentic AI的發展道路上,大模型開始強調上下文記憶能力,這是自主決策的前提。Google的AI助手Gemini已能記住訂閱用戶的生活信息、工作內容和個人偏好。同時,模態能力和操作APP的能力的突破,使得AI助手的能力邊界不斷拓展。智譜的AutoGLM和Anthropic的computer use分別展示了在手機和電腦上實現AI助手操作APP的能力。
多家企業開始依托AI助手搭建第三方AI應用生態。微軟推出了Azure AI Foundry平臺,旨在幫助組織設計、定制和維護管理AI應用和AI助手。百度則推出了無代碼AI應用搭建工具秒噠,計劃支持創建數百萬個應用程序。蘋果前員工認為,Siri未能及時拓展第三方生態系統,是其后續發展乏力的原因之一。
當前的AI助手競爭,猶如一場激烈的社團話事人選舉。互聯網平臺作為上一屆話事人,不愿輕易交出權力;大模型創業公司作為新晉提名者,積極尋求上位;硬件廠商作為社團元老,試圖平衡各方利益;工具型產品則需要在各方勢力中做出選擇。在這場博弈中,大模型創業企業最為積極,國內外多家企業都推出了自己的AI助手產品,并不斷增強其內容生成和智能體連接能力。
互聯網平臺同樣不甘示弱,阿里、百度、騰訊、字節等大廠都推出了自己的AI助手產品,依托用戶、數據、場景和資源的深厚積累,步伐更加從容。硬件廠商則希望通過AI助手打破管道化的定位,實現用戶習慣、數據積累、屏幕識別和應用操作的深度融合。工具型產品則根據自身能力,選擇推出垂直場景AI助手或融入其他AI助手。
在這場話事人之爭中,模型能力、業務場景、用戶獲取和軟硬件整合等因素將決定最終的勝負。模型能力的提升是實現精準理解和靈活調用的基礎;豐富的Agent生態意味著更多的能力供給和更高的入口層級;軟硬件廠商需要找到助手時代的相處之道;而在產品體驗、生態成熟度相近的情況下,低成本掌控流量將成為關鍵。因此,硬件廠商和互聯網平臺在這方面具有天然優勢。