喬布斯在2010年為Siri描繪的愿景,正逐步成為人工智能助手領域的共同追求。Siri的聯合創始人Norman Winarsky回憶,喬布斯那時就已預見,一個能像真人般互動、理解并執行任務的私人助理,將帶來無可比擬的價值。時至今日,這一期待仍未改變,用戶依然渴望一個能理解自己、代勞多事、跨越任務與領域界限的強大助手。
OpenAI計劃在明年1月推出的AI助手產品,據稱將能實現自動發送工作郵件、規劃旅行計劃等功能,這正是向著喬布斯愿景邁進的又一嘗試。大模型的突破被視為縮短這一進程的關鍵。OpenAI高管不斷強調,AI Agent將是下一個重大突破,而美國銀行的一份研報也指出,相較于ChatGPT和Copilot,具備更強自主規劃與行動能力的Agentic AI正引領一個超級創新周期。
在這個創新周期內,成為最接近用戶、連接最廣泛、能促進Agent協作的AI助手,被視為平臺級機遇。一方面,大模型支持下,基于自然語言的交互有望取代圖形界面,重構各種場景;另一方面,交互方式的變化或將打破軟硬件領域的平衡,既得利益者可能衰落,新興勢力或將崛起。
目前,競爭尚處于初級階段。參與者包括銳意進取的大模型創業公司、掌握主要平臺的互聯網巨頭、在巨頭夾縫中求生的中型公司,以及覬覦軟件利益的硬件企業。從通用AI助手到垂直領域AI助手,再到工具型AI助手,各個層級都有人在探索。
從GenAI到Agentic AI,AI的發展被劃分為三波浪潮。前GenAI階段,從1940年至2022年11月ChatGPT發布,AI主要助力數據驅動的決策。而GenAI階段,則集中在更自然的人機交流和提升個人效率上。Salesforce AI Research的執行副總裁兼首席科學家Silvio Savarese認為,Agentic AI階段正轉向使用AI自動化任務并代表用戶行動,這是能力上的重大飛躍。Gartner預測,到2028年,至少15%的日常工作決策將由Agentic AI自主做出。
為實現這一目標,大模型開始強調上下文記憶能力,這是自主決策的前提。Google的AI助手Gemini已能記住訂閱用戶的生活信息、工作內容和個人偏好。同時,技術突破讓大模型獲得模態能力和操作APP的能力,邊界不斷擴展。智譜的AutoGLM和Anthropic的computer use展示了在手機和電腦上操作APP的能力,手機廠商也在發布會上展示了AI在外賣點單、預定餐廳等方面的應用。然而,這些嘗試仍處于初期階段。
不少企業已開始依托AI助手搭建第三方AI應用生態,微軟推出了Azure AI Foundry平臺,百度推出了無代碼AI應用搭建工具秒噠。在蘋果前員工看來,Siri未能盡快拓展第三方生態系統是其后繼乏力的原因之一。在AI助手語境下,第三方應用生態本質上是AI助手可調用的資源庫,通過理解用戶需求,調用相應資源滿足需求。
當前的AI助手競爭,如同電影中的社團話事人選舉。上一屆話事人,即互聯網平臺,不愿交出權力;新提名者,即大模型創業公司,渴望進入權力中心;硬件廠商作為元老,試圖平衡利益;工具型產品則選擇站隊。大模型創業企業最為積極,依托對話能力推出AI助手產品,并不斷增加內容生成和智能體連接能力。一些明星企業實現了快速增長,但隨著資源向應用傾斜,可能后繼乏力。
互聯網平臺大廠也未放棄競逐機會,阿里的通義、支付寶的支小寶、百度的文小言、騰訊的元寶、字節的豆包等,都已搭建起AI助手框架。相較于創業企業,這些巨頭在用戶、數據、場景、資源上積累更深,步伐更從容。豆包的歷史累計下載量已破億,與第二名拉開距離。阿里和騰訊在AI助手競爭上具有更強的系統性優勢。
硬件廠商在移動互聯網階段未能吃到紅利,AI助手提供了一個融合用戶習慣、數據積累、屏幕識別、應用操作的機會。硬件能為用戶提供調用AI助手的更短路徑,還能實現端云混合AI,保護數據安全與用戶隱私。工具型產品則選擇推出面向垂直場景的AI助手,或融入其他AI助手中。
最終決定話事人歸屬的,是綜合實力,涵蓋模型能力、業務場景、用戶獲取、軟硬件整合等方面。模型能力依然重要,無論是理解用戶意圖還是調用其他Agent,都需依托模型能力提升。助手能鏈接的能力豐富度將決定入口層級高度,足夠豐富的Agent生態意味著足夠的能力供給,能將眾能力整合在生態內的助手將成為更底層的AI助手。軟硬件廠商需要找到助手時代的相處之道,硬件與助手一體兩面,找到一個能滿足軟硬件利益訴求的AI助手商業鏈路至關重要。在模型能力、產品體驗、生態成熟度相差不大的情況下,助手之爭還是流量之爭,低成本掌控流量是成為AI助手話事人的前提。