在人工智能領(lǐng)域,智譜AI作為大模型賽道的佼佼者,近期公布了其最新的AI應(yīng)用進(jìn)展,引發(fā)了廣泛關(guān)注。在北京智譜GLM OpenDay活動(dòng)上,智譜AI首席執(zhí)行官張鵬親自揭曉了兩款創(chuàng)新產(chǎn)品——AutoGLM和GLM-PC。
AutoGLM是智譜AI推出的首個(gè)產(chǎn)品化智能體Agent,它基于公司自研的“基礎(chǔ)智能體解耦合中間界面”與“自進(jìn)化在線課程強(qiáng)化學(xué)習(xí)框架”。這款智能體能夠通過文字或語音指令模擬人類操作手機(jī),實(shí)現(xiàn)了大模型從“言語”到“行動(dòng)”的范式轉(zhuǎn)變。目前,AutoGLM已經(jīng)開啟了“百萬內(nèi)測(cè)”的申請(qǐng)通道,吸引了眾多用戶的關(guān)注。
GLM-PC則是另一款令人矚目的產(chǎn)品,它基于CogAgent模型的視覺理解和任務(wù)規(guī)劃能力,能夠操作計(jì)算機(jī)的桌面應(yīng)用。用戶只需通過簡(jiǎn)單的一句話,GLM-PC就能快速執(zhí)行復(fù)雜任務(wù)。GLM-PC還具備任務(wù)規(guī)劃、屏幕界面信息理解的能力,能夠根據(jù)頁面信息進(jìn)行計(jì)劃更改和自我糾錯(cuò),從而精準(zhǔn)完成用戶指令。
在發(fā)布會(huì)上,張鵬表示,AI Agent目前備受矚目,從蘋果的Siri、谷歌的Assistant,到OpenAI即將推出的Operator,全球科技巨頭都在這一領(lǐng)域進(jìn)行布局。智譜AI率先開放AutoGLM內(nèi)測(cè),受到了業(yè)界的廣泛關(guān)注,僅過去一個(gè)月,申請(qǐng)頁面就已有超過百萬的用戶訪問。
張鵬還透露,盡管業(yè)界對(duì)大模型寄予厚望,但這也是一個(gè)高投入的領(lǐng)域。信息的理解依賴于底層技術(shù),而底層技術(shù)并非單一能力所能涵蓋。若要將AI作為生產(chǎn)力工具,需面對(duì)全面性的需求,可能會(huì)存在明顯的短板。因此,智譜AI不僅在技術(shù)上進(jìn)行布局,還在產(chǎn)業(yè)生態(tài)上進(jìn)行了深入規(guī)劃。智譜AI的定位是“開放平臺(tái)”,旨在助力合作伙伴改造原有產(chǎn)品,探索新的可能。
在談到Scaling Law時(shí),張鵬表示,盡管由于數(shù)據(jù)和訓(xùn)練規(guī)模的原因,Scaling Law可能不會(huì)像之前預(yù)測(cè)的那樣指數(shù)級(jí)上漲,但放寬視野來看,我們?nèi)栽趯ふ椰F(xiàn)象的本質(zhì)。他依然對(duì)Scaling Law持樂觀態(tài)度,認(rèn)為其仍有很大的發(fā)展空間,將繼續(xù)推動(dòng)技術(shù)進(jìn)步。特別是視覺Scaling Law仍在上漲,計(jì)算量可能是其發(fā)展趨勢(shì)的最佳解釋。
成立于2019年的智譜AI,源自清華大學(xué)計(jì)算機(jī)系的技術(shù)成果轉(zhuǎn)化,是清華大學(xué)知識(shí)工程(KEG)實(shí)驗(yàn)室的衍生企業(yè)。作為國內(nèi)最早進(jìn)入大模型賽道的公司之一,智譜AI在業(yè)界享有“大模型六小虎”之一的美譽(yù)。自2023年3月推出千億開源基座對(duì)話模型ChatGLM系列以來,GLM大模型已經(jīng)經(jīng)歷了四個(gè)大版本的迭代,發(fā)布了超過20款A(yù)I模型技術(shù)和產(chǎn)品。
智譜AI聚焦于基座模型的研發(fā)投入,以TO B賽道為主,TO C賽道為輔。張鵬曾表示,國內(nèi)大模型賽道過于擁擠,導(dǎo)致內(nèi)耗嚴(yán)重。更符合商業(yè)規(guī)律的模式應(yīng)是先建立基座大模型,再發(fā)展行業(yè)側(cè)模型,最后面向更加細(xì)分場(chǎng)景的推理模型。國內(nèi)創(chuàng)業(yè)生態(tài)在分層方面較美國略慢,而美國在多樣性方面則擁有更多選項(xiàng)。
在TO B端層面,截至2023年底,智譜AI已擁有超過2000家生態(tài)合作伙伴,超過1000個(gè)大模型規(guī)模化應(yīng)用,覆蓋了傳媒、咨詢、消費(fèi)、金融、新能源、互聯(lián)網(wǎng)、智能辦公等多個(gè)細(xì)分場(chǎng)景。在融資方面,智譜AI已完成九輪融資,總額接近60億元人民幣,其中包括多家知名投資機(jī)構(gòu)的參與。
如今,智譜AI全面發(fā)力AI智能體應(yīng)用,已在芯片、應(yīng)用App、操作系統(tǒng)OS和模型側(cè)進(jìn)行了長時(shí)間、全鏈路的布局。智譜AI與高通、三星、英特爾、榮耀、華碩等端側(cè)芯片、手機(jī)、電腦廠商合作,共同推動(dòng)大模型應(yīng)用落地,在AIPC、智能助手等領(lǐng)域取得了顯著成果。
張鵬認(rèn)為,通過端側(cè)芯片性能優(yōu)化和端云一體架構(gòu),Agent不僅能在操作系統(tǒng)OS和應(yīng)用App上實(shí)現(xiàn)用戶體驗(yàn)變革,還能將其推廣到各類智能設(shè)備上,實(shí)現(xiàn)基于大模型的互聯(lián)互通。今天的Agent已經(jīng)能夠像人一樣理解界面、規(guī)劃任務(wù)、使用工具、完成任務(wù),從而更聰明地代替人類行動(dòng)。
他分析稱,大模型發(fā)展至今已逐步具備與人類與現(xiàn)實(shí)物理世界互動(dòng)的能力,包括L1語言能力(已達(dá)80%)、L2邏輯能力(多模態(tài)能力,已達(dá)60%)、L3使用工具的能力(已達(dá)30%),甚至L4自我學(xué)習(xí)的能力也正在逐漸出現(xiàn)。智譜AI致力于將這種“理解”能力融入各行各業(yè)及各種場(chǎng)景,不斷探索大模型的“序列輸出”意味著什么,以及應(yīng)以何種形式呈現(xiàn)。
張鵬在會(huì)后交流時(shí)表示,看待問題應(yīng)更多從技術(shù)導(dǎo)向和目標(biāo)導(dǎo)向出發(fā),而不僅僅是局限于單項(xiàng)技術(shù)的快速變現(xiàn)。智譜AI的最終目標(biāo)是幫助大家切切實(shí)實(shí)地解決生產(chǎn)力的問題,而非簡(jiǎn)單盈利。因此,需要更長遠(yuǎn)地去做這個(gè)事情,從生態(tài)建設(shè)上也是如此。智譜AI正在與眾多伙伴和客戶合作,共同構(gòu)建發(fā)展自己的應(yīng)用和商業(yè)價(jià)值。
在談到AI智能體和搜索的關(guān)系時(shí),張鵬提到,在辦公應(yīng)用場(chǎng)景中,AI Agent助手可以幫助用戶解決一些問題,提升工作效率。智譜AI希望推動(dòng)AI Agent技術(shù)本身的應(yīng)用產(chǎn)生價(jià)值,而搜索是一個(gè)重要場(chǎng)景。他強(qiáng)調(diào),AI Agent已經(jīng)對(duì)人機(jī)交互形式產(chǎn)生了極大的影響,未來有望基于大模型智能能力實(shí)現(xiàn)原生的人與機(jī)器交互方式LM-OS,這將從根本上改變?nèi)伺c機(jī)器交互的方式。