作者 | 王瑞平
如今,伴隨著大語言模型技術的不斷成熟,專業人員開始致力于用它構建智能體,但卻始終停留在執行簡單任務的層面,缺少深入挖掘復雜任務的功能。這也是由于之前的大語言模型會產生相應“幻覺”問題,從而阻礙了發展。
但是,Meta卻打破了這個“魔咒”,開源了名為“MetaGPT”的框架,上線短短幾周就已火爆全網,截至目前,已在Github上狂飆16.9k星,成為了Meta在人工智能界投下的又一枚重磅炸彈!
從Github上的開源列表中不難看出,MetaGPT能抽象出不同角色,是一個集產品經理、架構師、項目經理、程序員于一體的AI工具。神奇的是,它能在代碼生成時進行內部監督,從而提升最終輸出的代碼質量。
有了它,軟件公司的研發工作流程將會被徹底改變;它不僅能幫助公司提升研發效率,還能降低研發成本。
因此,開發者普遍表示:“該模型在‘模擬現實軟件開發過程’中能提供更多的變量、監督效果更佳,相較于競品生成的輸出結果也更具有優勢。”
1、多智能體元編程框架
簡單來說,MetaGPT構建的多智能體元編程框架旨在將有效的人類工作流程作為元編程方法注入到由LLM驅動的多智能體協作中。模型的編程框架正是基于ChatGPT和軟件外包公司的SOP訓練的!其中,Code=SOP(Team)是核心哲學。
軟件公司多角色示意圖(正在逐步實現)
如框架圖所示,它能根據老板的“一句話”需求輸出產品文檔、架構設計、任務列表和代碼等,可被看作是由大語言模型構成的虛擬團隊。
首先,MetaGPT將標準化操作程序(SOP)編碼到Prompt中,將多個智能體協作過程結構化。然后,研究團隊進一步讓輸出模塊化,賦予智能體與人類工作者相應專業領域知識,從而驗證輸出并減少復合錯誤。通過這種方式,MetaGPT 以工作流水線的形式為各個智能體分配了不同的角色,進而建立了一個能夠有效、凝聚地解構復雜多智能體協作問題的框架。圖片
官方文檔中還展示出它的具體安裝方法,在其中輸入“Python/ target=_blank class=infotextkey>Python startup.py”,寫個類似“今日頭條”的推薦系統,將會獲得一系列輸出,包括:數據結構和API設計等。
至于費用方面,生成一個包含分析和設計的示例大約需要0.2美元(GPT-4 API的費用),而完成一個完整的項目大約需要2.0美元。
圖:MetaGPT框架
ITBEAR上發布的科技信息也顯示,MetaGPT模型可應用于各種開發任務。假如你需要構建一個算法推薦系統,模型可以分析系統的適用人群、列出適用人群特征并提出相應的功能需求,最后生成代碼并驗證。與傳統的手動開發相比,它可以在短時間內更迅速地完成這些任務,從而降低開發成本。
這種結構化過程、代理協作和高級模型驅動技術的融合正在改變軟件開發的前景。在此過程中,研究者做出的貢獻主要包括:引入元編程框架、整合人工SOP流程設計、實現最先進的性能。
結果表明,MetaGPT有潛力解決LLM中的幻覺問題,從而指導LLM系統協同完成更有效的設計。
雖然這聽上去效果不錯,但卻不能完全替代手工開發。開發者對于通用模型的輸出結果還是要有心理預期,畢竟此類場景還是需要用專業的垂直領域知識訓練效果才會更好!
2、全能:產品經理+架構師+項目經理+工程師
MetaGPT作為全能的AI工具,直接充當了產品經理、架構師、項目經理和工程師的角色,包攬了與開發相關的所有工作!主要功能是智能化生成代碼,即,輸入需求后“寫出”完整代碼。
具體來講,無論是產品的PRD文檔,還是項目架構分析,它都能完整的寫出,還能提示你用的是哪種語言、哪個框架,最后自動生成相關流程圖表,還真是有模有樣!
而之前提及的GPT-Engineer只“扮演”了單一工程師的角色;MetaGPT卻能扮演多個角色,這是最大的優勢,就連服務器接口規范它都能完整列出,還能自動對代碼邏輯進行分析,并提示你每個文件能用來做什么。
有的網友好奇,便用它書寫了命令行版的貪食蛇游戲,代碼生成效果相當不錯!蛇真的可以跑起來、吃豆子長尾巴、撞自己或撞墻后重置!
此外,MetaGPT還可以在大約10分鐘內構建出二十一點游戲,包括:代碼、圖表、評論和文檔,所有這些都只需2美元,這近一步為AGI鋪平了道路。
3、工程師:一行需求完成端到端開發過程
MetaGPT框架前途無量!當我們仔細審視模型內部時,會發現內部實際上就是一個完整的軟件公司,由多個智能體協作完成復雜的軟件問題。
具體來說,為了將Sop編碼為提示符,MetaGPT通過角色定義、任務分解、過程標準化和其它技術設計,只用一行需求就能完成端到端開發過程。相關論文也已發表。
實驗結果也表明,MetaGPT可以產生更高級的綜合解決方案。與現有會話和基于聊天的多代理系統相比,它的一致性更強。
最后,為證實設計的有效性,研究者展示出軟件協同開發的工作流程,并進行了相關實驗來驗證相關代碼的可行性。
在代碼生成基準測試中,MetaGPT達到81.7%和82.3%的新高度。這意味著,與其它基于LLM的編程框架(如,AutoGPT、LangChain和AgentVerse)相比,MetaGPT可以處理更高級別的軟件、解決復雜問題,也憑借其廣泛的功能脫穎而出。
值得注意的是,在相關的實驗評估中,MetaGPT達到了100%的任務完成率,進一步證實了MetaGPT框架的高效性。
總之,這項研究通過集成標準操作程序為基于LLM的多智能體系統概述了一個變革的范例。這將會為多智能體交互和相關合作開辟出新道路,不僅重新定義了人工智能,還指出通往AGI的道路。
4、局限性:無法處理復雜信息
然而,需要注意的是,MetaGPT有一些局限性:例如,它只能創建單頁的應用程序,而不能處理復雜的信息,如,多頁或數據庫。因此,如果你的想法非常復雜,MetaGPT可能無法正確生成應用程序。
盡管有這些限制,MetaGPT仍有望成為創建簡單應用程序的有效工具。此外,它的易用性可能對軟件開發市場產生重大影響,從而減少對經驗豐富程序員的需求。
參考資料:https://arxiv.org/pdf/2308.00352.pdf