日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

聲明:本文來自于微信公眾號 新智元(ID:AI_era),作者:新智元,授權(quán)轉(zhuǎn)載發(fā)布。

【新智元導(dǎo)讀】有了這個實在的Agent小助手,文秘小帥的辦公流程,簡直叫一個行云流水。

最近,有了一個神秘助手的小帥,辦公效率比過去提高了十倍不止。

今天,他需要把銷售人員的銷售金額做個排序,再把清單通過釘釘發(fā)給張總。

圖片

不用多費口舌,小助手立馬準(zhǔn)確讀取了小帥的需求。

圖片

隨后,小助手干脆利落地給自己列出了行動計劃,不到一分鐘,銷售金額從高到低排序的清單,就赫然出現(xiàn)在了桌面上。

圖片

然后,小助手打開釘釘,自動選定了發(fā)送對象——張總,然后把清單發(fā)送了出去。

圖片

這行云流水的一套流程,簡直讓人看呆了。莫非《鋼鐵俠》中的賈維斯AI助理成真了?

你說,PC做——AI開啟人類辦公新篇章

在介紹這位神秘助手的身份之前,我們先回顧一下,77年前的人類,是怎樣使用電腦的。

時間回到1946年,世界上第一臺計算機ENIAC誕生。連接一堆線纜、切換一堆開關(guān),就是人類歷史上首次使用電腦的方式。

77年后的今天,ChatGPT的誕生顛覆了人類社會。GPT-4、PaLM、Llama等大模型的相繼爆發(fā),讓AI迎來了歷史性的「iPhone時刻」。

微軟辦公Office365接入GPT-4,PaLM整合進谷歌Workspace。AI大模型的誕生和崛起,讓打工人的辦公場景發(fā)生了根本性變革。

最近爆火的智能體Agent,更是讓賈維斯、《科幻世界》中的機器人小秘書和《星際穿越》中的「塔斯」(Tars)機器人,從科幻走進現(xiàn)實。

正如開頭所演示的,我們只要動動嘴,電腦就能自己動起來,讓原本枯燥繁瑣的工作搖身一變,成為——「你說,PC做」。

而這位能夠「聽得懂,想明白,看得見,動起來」的數(shù)字助理,便是實在智能發(fā)布的業(yè)內(nèi)首款基于大模型的Agent產(chǎn)品TARS-RPA-Agent,也叫ChatRPA。

它不僅能夠理解人類的意圖,還能操作所有桌面軟件,包括各種復(fù)雜的CS架構(gòu)軟件,甚至對不開放接口的軟件也能操作。

在CV大模型ISSUT(智能屏幕語義理解技術(shù))的加持下,TARS-RPA-Agent就像戴上了酷炫的屏幕洞察眼鏡,眨眼間就能秒懂屏幕上的一切。

甚至,不僅是在電腦上,任何屏幕(比如車載平板)都可以實現(xiàn)這個操作。

舉個例子,這意味著,后續(xù)在汽車環(huán)境下,除了當(dāng)下已通過接口方式實現(xiàn)對所有車載設(shè)備進行控制,如控制車窗空調(diào)、播放音樂、導(dǎo)航等簡單操作之外,還可以通過語音指令輕松指揮車載平板上所有的軟件APP(如釘釘、微信、甚至是WPS、美圖秀秀等)自動完成各種復(fù)雜工作任務(wù)。

可以說,TARS-RPA-Agent成就的是更加科幻感滿滿的未來,促進人類實現(xiàn)真正的人機協(xié)同。

在未來,人類與電腦/手機的協(xié)同方式一定是讓技術(shù)適應(yīng)人,而非人適應(yīng)技術(shù)。產(chǎn)品也不再是以系統(tǒng)為中心,而是以人為中心。

在這種全新人機協(xié)同模式下,AI將更加智能化、人性化。

與此同時,人類也不用花費大量時間去學(xué)習(xí)如何操作一個新的應(yīng)用或工具,而Agent可以理解我們的需求和習(xí)慣,做出調(diào)整。

這意味著,當(dāng)AI從一個被動工具,變?yōu)橐粋€智能助手,將會更加重視我們的習(xí)慣,確保在執(zhí)行任務(wù)要求同時,為人類創(chuàng)造出更加人性化的體驗。

想讓Agent替你打工?層層難關(guān)需攻克

然而,這項劃時代性技術(shù),需要克服的困難,遠比我們想象的要多。

尤其是,想要讓AI Agent在行業(yè)中發(fā)揮出真正的商業(yè)價值,更非易事。

圖片

當(dāng)你要求Agent幫自己請假時,大模型雖然能做到「理解意圖」,但要操作像釘釘這種沒有可解析的網(wǎng)頁源代碼,或可調(diào)用的API接口的應(yīng)用時,還需要另尋它法。

相比之下,RPA可以模擬人類行為的方式,對電腦軟件完成操作。由此可見,大模型+RPA方式是執(zhí)行如上幫你請假等任務(wù)的一種必然模式。

但隨之而來的另一個問題是,傳統(tǒng)的RPA由于不能對軟件頁面進行精準(zhǔn)識別,比如哪個是輸入框,哪個是登錄入口等等,在面對諸多任務(wù)時也還是會一籌莫展。

而當(dāng)前計算機視覺CV大模型的發(fā)展,能夠為此提供一種解決方案,讓RPA在執(zhí)行任務(wù)時「看見」操作頁面,秒懂屏幕畫面。

接下來,在解決了接口調(diào)用、圖像理解這兩個問題之后,AI Agent還需要突破四大難關(guān),才能成為真正意義上的「數(shù)字員工」:

「能否自主拆解任務(wù)、能否感知當(dāng)前環(huán)境、能否執(zhí)行并且反饋、能否記憶歷史經(jīng)驗。」

1. 如何輕松實現(xiàn)任務(wù)的自主拆解?

首先,在實際的場景中,人類給出的指令是非常復(fù)雜的,但所用的語句卻非常簡潔。如何從蘊含龐雜信息和邏輯命令的指令中,理解并拆解任務(wù)是非常難的。

比如「訂一張明天到上海的高鐵車票」,就涉及到數(shù)量「一張」、時間「明天」、行程「到上海」、目標(biāo)「買高鐵票」。

想要最終完成這個任務(wù),就要求Agent必須能夠理解指令,并將其拆解成可執(zhí)行的子任務(wù)和步驟。比如,登錄購票網(wǎng)站、查詢余票信息、完成車票預(yù)訂等多個步驟。

2. 如何實現(xiàn)任務(wù)元素的精準(zhǔn)定位?

除了要把任務(wù)分解成可執(zhí)行的子模塊外,Agent還必須知道自己是誰、在哪。

比如,訂明天的票,就意味著Agent需要知道今天是幾號;有了終點上海,也需要知道自己所處的起點是哪個城市。

與此同時,Agent還需要對周邊的環(huán)境有充分的認知、理解和交互。

還是以剛剛的購票任務(wù)為例,要完成「登錄購票網(wǎng)站」這一步,就需要Agent明確地知道,賬號輸入、密碼輸入,以及登錄按鈕分別在屏幕上的什么位置。

3. 錯誤會不斷積累,需要及時去更正

在執(zhí)行任務(wù)時,人類會隨時關(guān)注進度,并通過不斷的「執(zhí)行-反饋-修正」來確保任務(wù)的正常進行。

對于Agent來說,同樣需要保證每一步操作的正確性,不會因為領(lǐng)會錯了意圖,或者前一步操作失誤,而導(dǎo)致當(dāng)前步驟點錯按鈕、輸錯賬號或者發(fā)錯郵件。

最好是還能夠進行單步尋優(yōu),并且把每一步的執(zhí)行過程和結(jié)果都展示和反饋出來。

4. 解決長時記憶,實現(xiàn)自主迭代能力

最后,Agent還需要具有從經(jīng)驗中學(xué)習(xí),并通過歷史案例不斷能提升自己決策的能力。

特別是在人類的幫助下完成一項任務(wù)之后,可以在下次遇到同樣的任務(wù)時,自己去正確地執(zhí)行。

舉個例子,為了解決這個困擾大模型已久的長時記憶問題,AutoGPT選擇的就是利用內(nèi)存管理的手段,來實現(xiàn)上下文保留和決策優(yōu)化能力。

AI Agent時代的爆款:TARS大模型智能助理

面對這一系列的挑戰(zhàn),實在智能創(chuàng)新性地把CV大模型(ISSUT)、LLM(TARS大模型),以及RPA整合在了一起,并通過不同的技術(shù)、設(shè)計和方法解決了上述難點。

由此誕生的TARS-RPA-Agent,也成為了一個能夠自主拆解任務(wù)、感知當(dāng)前環(huán)境、執(zhí)行并且反饋和記憶歷史經(jīng)驗的超自動化智能體。

在TARS-RPA-Agent的加持下,對于發(fā)郵件這種基本操作,你只需要在對話框中,輸入「使用163郵箱給×××發(fā)送郵件,說你好」即可。

接下來,TARS-RPA-Agent將這個描述的請求拆解為2個步驟。第一步:打開163郵箱;第二步:登錄郵箱發(fā)送郵件。在每個計劃中,都包含了詳細的執(zhí)行步驟。

確認無誤后,直接點擊「執(zhí)行」,就能看到TARS-RPA-Agent嗖嗖嗖,開始掃描頁面,完成給定的任務(wù)。

圖片

除了發(fā)郵件,諸如請假等各種辦公場景,TARS-RPA-Agent也全能覆蓋,而且還有著優(yōu)秀的泛化能力。

比如,當(dāng)你想買一款筆記本電腦,但又不知道選哪款比較好時,就可以問Agent「京東上最暢銷的筆記本電腦是什么」。

圖片

很快,Agent就給自己定出了行動計劃,然后根據(jù)我們的需求,自己登入京東進行搜索排序,并進入第一個結(jié)果的詳情頁。

值得一提的是,TARS-RPA-Agent還考慮到了現(xiàn)有的Agent容易陷入死循環(huán)并消耗大量tokens的問題,在任務(wù)過程中可允許人工修改、調(diào)優(yōu)等,在產(chǎn)品上能夠更好地支持人機協(xié)同操作。

比如,遇到不能執(zhí)行的步驟,我們只需動動嘴,或者點擊頁面的元素,就能讓它自動創(chuàng)建后面的流程,基本上無需人類操作就能完成。

圖片

另外,如果這過程中我們有了新的計劃,直接用嘴告訴TARS-RPA-Agent就可以。

在記錄下選中的產(chǎn)品信息之后,還會貼心地幫你保存下來。

以往,這些功能都得需要在已有組件上去做各種形式的流程實現(xiàn),不僅復(fù)雜,而且難度高。

而現(xiàn)在,有了TARS大模型的加持,直接讓TARS-RPA-Agent擁有「遇河搭橋」的能力。即便是沒有可調(diào)用的組件,TARS-RPA-Agent也能夠直接生成一個組件,讓整個工作流暢通無阻。

對于那些沒有編程能力的人來說,無疑是釋放了生產(chǎn)效能。

圖片

不僅如此,在大模型的加持下,同樣的操作也可以輕松泛化到其他平臺上。而這一點的實現(xiàn),只需要你把「京東」這兩個字換成「淘寶」就可以了。

此外,在流程執(zhí)行結(jié)束后,也還可以繼續(xù)對話,并增加新的執(zhí)行計劃來完成流程能。

圖片

這些看起來十分簡單的操作,實際上體現(xiàn)的是TARS-RPA-Agent三種強大的能力——視覺識別、邏輯推理,和代碼生成。

首先,TARS大模型本質(zhì)上是一個語言模型,能夠分析推理,卻「看不到」要執(zhí)行的對象。但有了ISSUT視覺技術(shù)的加持,它就像是有了一雙眼睛,能夠進一步操作對象,驅(qū)動RPA去創(chuàng)建整個流程。

其次的邏輯推理能力,讓TARS-RPA-Agent能夠?qū)⒏鱾€組件變量的邏輯關(guān)系進行串聯(lián)。

而代碼生成能力,則是讓它可以在沒有基礎(chǔ)組件的流程步驟中直接生成一段代碼,封裝成自建組件,在之后可以隨時調(diào)用。

基于此,用戶只需動嘴提出需求,Agent就能自動拆解任務(wù),根據(jù)屏幕語言理解,夠完成實時流程搭建和執(zhí)行。

可以說,實在智能的TARS大模型在超自動化場景與Agent的融合和應(yīng)用,是國內(nèi)企業(yè)向大模型Agent場景化應(yīng)用創(chuàng)新邁進的重要一步。

并在最終,實現(xiàn)人類意圖的超越,成為駕馭桌面的終極力量。

「Agent」:AI引領(lǐng)下的下一個人機協(xié)同前沿

要知道,時間不是衡量偉大技術(shù)創(chuàng)新的標(biāo)準(zhǔn),有時候,速度才是真正的量尺。

當(dāng)今LLM(大語言模型)最主要的能力體現(xiàn)在,處理和生成內(nèi)容。但結(jié)果的生成,需要以輸入作為前提。

在當(dāng)前快速發(fā)展的背景下,LLM僅僅滿足于其擁有的聊天、創(chuàng)作、繪畫、社交等功能是遠遠不夠的。

而Agent作為一種能夠感知環(huán)境,做出決策的智能體,則可以在循環(huán)中運行,生成自我導(dǎo)向的指令和操作,不依賴人類來指導(dǎo)對話,更加足以讓人放開想象。

由此,我們可以讓LLM去充當(dāng)Agent的「大腦」。通過LLM和Agent的結(jié)合,能夠讓AI自動化處理更加復(fù)雜的任務(wù)。

如此一來,Agent智能助手就可以變身一個「數(shù)字打工人」,讓我們工作效率大大提升,最終為人類提供更多的實用價值。

而這,也是大模型下一階段的必然發(fā)展方向。

圖片

為了擴展LLM的應(yīng)用,國外的研究人員提出了以AutoGPT,GPT-Engineer和BabyAGI等項目為代表的全新形式——集成大語言模型的Agent。

通過將大語言模型作為Agent的核心大腦,就可以實現(xiàn)復(fù)雜任務(wù)的分解,并在每個子步驟實現(xiàn)自主決策,無需用戶參與即可解決問題。

圖片

比如,今年4月爆火的Auto-GPT,現(xiàn)在已經(jīng)在GitHub上狂攬了147k星。

這個項目的意義在于,Auto-GPT就像是給GPT-4模型裝了一個身體。在接到用戶提交的任務(wù)之后,自己就能提出并執(zhí)行相應(yīng)的計劃。不到5分鐘,一個網(wǎng)站就搭建好了。

圖片

接入GPT-4大模型的GPT-Engineer也是同樣的原理,只需動動嘴,給出一個提示,開發(fā)者就可以構(gòu)建整個代碼庫。

然而,這些新晉頂流的Agent卻有著不少自身的局限性,比如使用GPT-4API費用高昂、需要一定的編程基礎(chǔ)、應(yīng)用范圍也相對較窄。

甚至,因為GPT-4固有的局限性,比如胡說八道、犯推理錯誤,有時也會導(dǎo)致Auto-GPT等并不可靠。

圖片

除了學(xué)術(shù)上的探索外,在硅谷,已經(jīng)有人找出了讓Agent商業(yè)化落地的答案。

今年3月,由前OpenAI工程副總裁成立的初創(chuàng)企業(yè)Adept,一舉狂攬3.5億美元融資,除了General Catalyst和Spark Capital聯(lián)合領(lǐng)投,還有眾多機構(gòu)和硅谷明星創(chuàng)業(yè)者跟投。

簡單來說,Adept創(chuàng)造了一個名為Action Transformer(ACT-1)的「AI隊友」,能夠?qū)⑽谋久钷D(zhuǎn)化為一系列行動。

比如,通過連接到Chrome瀏覽器的擴展程序,在人類的提示下進行某些操作,或者與Salesforce和電子表格配合,以往需要點擊10次以上的復(fù)雜操作,一句話即可完成。

圖片

業(yè)界首家推出大模型Agent的公司

雖然,必須借助API才能實現(xiàn)軟件調(diào)用的形式極大地限制了ACT-1的使用場景,但Adept依然拿到了強有力的融資。由此也可以看出,行業(yè)內(nèi)對Agent辦公的強大信心,和這種趨勢的一致認可。

現(xiàn)在,隨著技術(shù)的進一步發(fā)展,AI Agent更是成為了業(yè)界公認LLM落地的有效方式之一。

而國內(nèi)公司的腳步,自然也沒有落下。

作為國內(nèi)首家推出大模型Agent的企業(yè),實在智能才成立5年,就榮譽傍身。

連續(xù)3年獲評AI準(zhǔn)獨角獸企業(yè),通過國家高新技術(shù)企業(yè)及CMMI-5全球軟件成熟度最高級別認證(全球不到1800家),擁有200余項獨立自主知識產(chǎn)權(quán)、實際授予的發(fā)明專利53項,位列行業(yè)第一

數(shù)十人的高水平算法團隊,NLP、CV、以及OCR技術(shù)在國內(nèi)均為第一梯隊。

實在智能不斷蝶變創(chuàng)新的背后,是技術(shù)研發(fā)實力深厚的體現(xiàn),以及倍增的實際效益。

2020年,這家公司首次推出了RPA產(chǎn)品,并在業(yè)界首次提出「融合拾取」技術(shù),讓RPA拾取精度實現(xiàn)跨越式發(fā)展。

圖片

2022年,智能屏幕語義理解技術(shù)ISSUT的發(fā)布,讓RPA戴上了「眼鏡」,從「拖拉拽」過渡到「點選用」。這種更新的IPA模式,也讓原本門檻極高的RPA工具變得人人可用。

圖片

2023年,實在智能憑借技術(shù)沉淀,再一次引領(lǐng)創(chuàng)新,將計算機視覺和大模型結(jié)合,推出TARS-RPA-Agent,這在全球的Agent領(lǐng)域也是不多見的,更是RPA領(lǐng)域的首創(chuàng)。

實在智能之所以選擇Agent作為產(chǎn)品的下一個發(fā)展方向,就是因為人工智能生成為驅(qū)動管理系統(tǒng)提供了一種全新的方式,可以直接生成并執(zhí)行各種可操作的業(yè)務(wù)流程。

通過整合AIGC,產(chǎn)品能夠?qū)崿F(xiàn)智能化,并為B端用戶提供高效、可執(zhí)行的解決方案。其中,LLM如果與企業(yè)管理軟件融合好,大模型便能順利落地。LLM的私有化部署能力,往往意味著廠商們更大的商機。

而TARS-RPA-Agent所依賴的LLM——實在智能的自研垂直TARS大模型,具有優(yōu)異的文本生成、語言理解、知識問答、邏輯推理等核心能力。

在TARS大模型的加持下,一種全新的「TARS + X」模式應(yīng)運而生。

如今,我們可以看到,ChatRPA為超自動化產(chǎn)品矩陣帶來的變革升級,讓未來辦公「只動嘴不動手」。

與此同時,實在智能的首款和文檔對話的產(chǎn)品Chat-IDP,也開創(chuàng)了文檔交互、文檔處理的新模式。

基于OCR+NLP的「智能文檔審閱」IDP產(chǎn)品,更是已經(jīng)達到全國領(lǐng)先,廣泛應(yīng)用于金融、教育、工業(yè)等各個行業(yè)。

從2023年開始,我們使用的電腦的方式,或?qū)⒈贿@家起步雖晚但技術(shù)雄厚、帶領(lǐng)行業(yè)彎道超車的AI準(zhǔn)獨角獸改變。

分享到:
標(biāo)簽:Agent 大模型
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨大挑戰(zhàn)2018-06-03

數(shù)獨一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運動步數(shù)有氧達人2018-06-03

記錄運動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定