【ITBEAR】在今年的CNCC大會(huì)上,智譜科技的一項(xiàng)新技術(shù)引發(fā)了廣泛關(guān)注——AutoGLM,一個(gè)能夠模擬用戶在手機(jī)和網(wǎng)頁(yè)上操作的智能助手。這一創(chuàng)新不僅展示了AI在日常生活中的應(yīng)用潛力,還標(biāo)志著智譜在通往通用人工智能(AGI)道路上的又一重要進(jìn)展。
智譜發(fā)布的AutoGLM功能強(qiáng)大,現(xiàn)場(chǎng)實(shí)測(cè)中,用戶只需一句話即可指令A(yù)I在美團(tuán)上點(diǎn)咖啡,全程無(wú)需人工干預(yù),除了付款環(huán)節(jié)。智譜還展示了其最新的GLM-4-Voice情感語(yǔ)音模型,該模型在情感表達(dá)、語(yǔ)音控制等方面表現(xiàn)出色,甚至能模仿多種方言和情緒。
在CNCC的圓桌論壇中,專家們討論了AGI的實(shí)現(xiàn)路徑,強(qiáng)調(diào)了多模態(tài)、推理與自我學(xué)習(xí)的重要性。智譜的AutoGLM正是其在工具能力上的新探索,也是其AGI實(shí)現(xiàn)路徑的一部分。
智譜的清言情感語(yǔ)音助手在多方面實(shí)現(xiàn)了突破,如響應(yīng)速度、情緒感知、情感共鳴等。在實(shí)測(cè)中,該助手不僅能進(jìn)行英語(yǔ)陪練,還能切換至日語(yǔ),甚至能模仿多種方言,如北京腔、臺(tái)灣腔、東北腔和粵語(yǔ)。
技術(shù)方面,AutoGLM基于智譜的GLM-4大模型家族,特別是新發(fā)布的GLM-4-Voice情感語(yǔ)音模型。該模型采用端到端的設(shè)計(jì),避免了傳統(tǒng)級(jí)聯(lián)方案中的信息損失和誤差積累,擁有更高的建模上限。
智譜在探索AGI的過(guò)程中,經(jīng)歷了從單一模態(tài)到多模態(tài)的轉(zhuǎn)變。其AGI路徑注重文本大模型的能力提升,同時(shí)逐步融入圖像、視覺(jué)、語(yǔ)音等模態(tài),并持續(xù)迭代代碼模型、視頻生成模型等。
智譜CEO張鵬介紹,智譜將人工智能分為L(zhǎng)1到L5五個(gè)等級(jí),其中L4和L5體現(xiàn)了AI的自我學(xué)習(xí)能力。目前,智譜發(fā)布的手機(jī)助手已達(dá)到L3的工具使用階段,并計(jì)劃在本月底推出升級(jí)版的視頻生成模型CogVideoX-Plus。
智譜內(nèi)部認(rèn)為,目前距離AGI的實(shí)現(xiàn)還有很長(zhǎng)的路要走。他們根據(jù)大腦的能力,將AGI的技術(shù)維度分為了多個(gè)方面,包括多模態(tài)感知與理解能力、長(zhǎng)短期記憶能力、深度思考與推理能力、情感與想象力等。