01
—
AI Agent的定義
AI Agent一直是AI圈的熱門話題,也是OpenAI 明確表示要發力的下一個方向。相比模型訓練方法,OpenAI 內部目前更關注AI Agent 領域的進展。
以AI目前的發展階段,尤其是LLM爆發后,AI Agent可以定義為:基于LLM驅動的Agent實現對通用問題的自動化處理。
AI Agent和ChatGPT、Claude等LLM(大語言模型)有什么區別呢?
LLM主要擅長處理和生成文本。它們可以回答問題、寫文章、生成創意內容、幫助編程等等。但LLM主要是一個被動的工具,只在你給它輸入時產生輸出。
而AI Agent提供了更廣泛的功能,特別是在與環境的交互、主動決策和執行各種任務方面。可以說,AI Agent是真正釋放LLM潛能的關鍵。LLM作為核心,而AI Agent則為LLM提供了行動的能力。
02
—
AI Agent的架構
近期,一篇關于AI Agent的博客文章刷爆了AI圈,作者是Lilian Weng,現為OpenAI應用人工智能研究負責人。此文可視為AI Agent的全面科普。
此文探討了以LLM為核心控制器構建AI Agent的概念。強調了如規劃、記憶和工具使用等關鍵組件。LLM的潛力不僅僅是生成內容,它們可以被視為強大的通用問題解決者。
作者將AI Agent定義為LLM、任務規劃、記憶和工具使用四個部分的組合。其中,任務規劃涵蓋了任務的細分和自我審視;記憶部分則包括感知型記憶、短時記憶和長時記憶;而工具使用則涉及任務的定義、選擇模型、執行任務以及產生反饋。
通俗點說,AI Agent就是以LLM為大腦,再賦予任務規劃能力、長短期記憶力、工具使用能力,即可實現自動化處理更復雜的任務。它具備獨立的思考和認知功能、擁有記憶,能進行思考、邏輯推斷和自我反思,可以閱讀和在線學習,擅長利用適當的工具處理問題,還能策劃并根據實際情況調整任務的優先級……
任務規劃:
子目標與分解:AI Agent將大任務分解為較小的、可管理的子目標,從而有效地處理復雜任務。
處理復雜任務往往需要多個階段,因此 AI Agents 必須先行了解并策劃這些階段。具備任務策劃能力的 Agents 可以更深入地把握任務的結構和目的,并據此分配資源和做出最佳決策,從而確保任務的效率和完成質量。
反思與完善:AI Agent可以對過去的行為進行自我批評和反思,從錯誤中學習,并為未來的步驟進行完善,從而提高最終結果的質量。
在任務策劃中,自省是關鍵的一步,它使 Agents 能夠修正以往的決策、糾正之前的失誤,從而不斷優化其性能。在實際任務執行中,嘗試和錯誤是常態,所以自省在這個過程中起到了核心作用。
記憶:
短期記憶:AI Agent利用模型的短期記憶進行上下文學習。
長期記憶:這為AI Agent提供了長時間保留和回憶信息的能力,通常通過利用外部向量存儲和快速檢索來實現。
工具使用:
AI Agent學會調用外部API以獲取模型權重中缺失的額外信息,包括當前信息、代碼執行能力、訪問專有信息源等。
人類的一大特點是會使用工具。我們通過創造、改進和使用外部物體來完成那些超出我們身體和思維能力的工作。同理,為LLM提供外部工具可以大大增強其功能,讓它應對更為復雜的任務。目前,主要是教LLM如何利用外部工具的API來達到這一目的。
03
—
AI Agent的未來
AI Agent未來的發展趨勢,大致可以劃分為兩個方向:自主代理(Autonomous Agent)和生成代理(Generative Agent)。
自主代理,如Auto-GPT,它能夠根據人們通過自然語言提出的需求,自動執行任務并實現預期結果。在這種合作模式下,自主代理主要是為人類服務,更像是一個高效的工具;
生成代理,如斯坦福和谷歌的研究者共同創建的西部世界小鎮。這是一個交互式的沙盒環境,在小鎮上,生活著25個可以模擬人類行為的生成式AI智能體。它們會在公園里散步,在咖啡館喝咖啡,和同事分享當天的新聞。,這種代理具有類似人的特質、獨立決策和長期記憶等功能,它們更接近于“原生AI-Agent”。在這種合作模式下,代理不僅僅是為人類服務的工具,它們在數字世界中與其他代理建立社交關系。
清華也出了個 ChatDev,讓 Agent 組了個游戲公司,有 CEO、設計師、程序員……多重角色,串聯在一起完成開發工作。
簡單來說,自主代理(Autonomous Agent)可以比喻為《我,機器人》或者鋼鐵俠的助理賈維斯,它不僅可以執行任務,還可以根據給定的目標自行規劃、創造任務和不斷進化。
而生成代理(Generative Agent)則像是《西部世界》中的機器人,它們在同一環境中生活,擁有自己的記憶和目標,不僅與人類交往,還會與其他機器人互動。
AI Agent是真正釋放LLM潛能的關鍵。LLM作為核心,而AI Agent則為LLM提供了行動的能力。
得益于LLM的推動,AI Agent展現出了豐富的功能性,預示著AI Agent將如同生物的大爆發,與人類形成一種數字化的伴隨/共生關系。
隨著AI Agent的廣泛應用,人類的合作網絡也將升級為一個人類與AI Agent的自動化合作體系。這將推動人類社會的生產結構進一步升級,從而影響社會的各個方面。
一個具備交流能力并能自主/自動執行任務的智能網絡將是互聯網的下一階段,而AI Agent正是我們與之交互和執行任務的智能工具。
未來,假如人人都配備一個AI agent,它們比人類更擅長處理大量信息和做出推理,我們的生活將發生什么樣的變化呢?
我們的組織結構會發生重大變革。傳統的公司可能不再是由大量的人類員工組成,而是由AI agent主導。這些agents可以24小時不停歇地工作,不需要休息,不會生病,也不會有情緒波動。它們可以快速、準確地完成各種任務,從數據分析到決策制定,再到執行任務。
我們的營銷策略也會發生變化。傳統的營銷目標是吸引人類消費者,但在這個新世界里,我們可能更多地是在向人類的助理agent推銷產品或服務。這意味著營銷策略需要更加精準、智能,因為你不再是在說服一個有情感的人,而是一個只看數據和邏輯的機器。
產品設計也會有所不同。未來的產品可能不再是為人類設計的,而是為其他產品的AI agent設計的。這意味著產品需要具有更高的互通性、智能性和自動化程度。
……
還有哪些可能的變化呢?盡情展開想象吧!