近日,由中國(guó)電子商會(huì)人工智能委員會(huì)主辦的2023北京人工智能峰會(huì)暨第三屆AI金雁獎(jiǎng)?lì)C獎(jiǎng)典禮在北京盛大舉行。循環(huán)智能(Recurrent AI)憑借在AI大模型技術(shù)上的創(chuàng)新、積累和應(yīng)用,經(jīng)過(guò)專(zhuān)家評(píng)審團(tuán)的層層評(píng)比和篩選后獲得了“2022人工智能技術(shù)創(chuàng)新大獎(jiǎng)”,循環(huán)智能聯(lián)合創(chuàng)始人楊植麟博士也被評(píng)選為“2022 AI領(lǐng)軍人物”。
中國(guó)AI金雁獎(jiǎng)是由來(lái)自人工智能領(lǐng)域從技術(shù)研發(fā)到市場(chǎng)營(yíng)銷(xiāo)和創(chuàng)投基金、從國(guó)家院士到企業(yè)高管和知名投資人等不同背景的專(zhuān)家和機(jī)構(gòu)組成的評(píng)審團(tuán),從多維度的觀察與剖析,多面向的評(píng)估與考核,經(jīng)過(guò)初審、復(fù)審到終審,層層評(píng)比、層層篩選出在AI技術(shù)和商業(yè)領(lǐng)域有著突破性重要貢獻(xiàn)的單位和個(gè)人,致力于不斷為中國(guó)人工智能科技領(lǐng)域發(fā)掘出優(yōu)秀的“頭雁”。
循環(huán)智能自主研發(fā)千億參數(shù)預(yù)訓(xùn)練NLP大模型“盤(pán)古”,是業(yè)內(nèi)首個(gè)千億參數(shù)的中文大模型,擁有1100億密集參數(shù),經(jīng)過(guò)40TB的海量數(shù)據(jù)訓(xùn)練而成。同時(shí)也通過(guò)多任務(wù)prompt等技術(shù)延伸出10億參數(shù)、性能更好的落地版本,極大地加速了AI的商業(yè)應(yīng)用效率和泛化能力,提升NLP模型生產(chǎn)效率10-1000倍。“盤(pán)古”大模型刷新了世界中文CLUE榜單三項(xiàng)記錄,并獲得了2021世界人工智能大會(huì)“SAIL之星”榮譽(yù)。應(yīng)用層面,循環(huán)智能提供基于“AI+銷(xiāo)售科技”的解決方案,目前已賦能超100萬(wàn)一線人員,日均處理上億次對(duì)話(huà),在各行各業(yè)積累了豐富的銷(xiāo)售增長(zhǎng)實(shí)踐、銷(xiāo)售分析模型和最佳溝通素材,累計(jì)生產(chǎn)了10000+面向各行業(yè)業(yè)務(wù)流程的AI數(shù)據(jù)模型。本次評(píng)選,循環(huán)智能憑借AI大模型技術(shù)創(chuàng)新、大量業(yè)務(wù)實(shí)踐贏得了評(píng)審團(tuán)的認(rèn)可,獲得“2022人工智能技術(shù)創(chuàng)新大獎(jiǎng)”和“2022 AI領(lǐng)軍人物”兩項(xiàng)大獎(jiǎng)。
頒獎(jiǎng)典禮上,循環(huán)智能聯(lián)合創(chuàng)始人兼CTO張宇韜博士作為獲獎(jiǎng)企業(yè)的代表,受邀發(fā)表了《AI大模型在企業(yè)服務(wù)場(chǎng)景下的實(shí)踐與探索》的主題演講,與現(xiàn)場(chǎng)領(lǐng)導(dǎo)、評(píng)審團(tuán)、行業(yè)專(zhuān)家、媒體和100多位企業(yè)代表分享了AI大模型在企業(yè)落地的主要挑戰(zhàn)、循環(huán)智能“千循零樣本平臺(tái)”多模型策略和應(yīng)用場(chǎng)景,以及在大模型在企業(yè)應(yīng)用場(chǎng)景的最新探索與實(shí)踐。
以下是演講內(nèi)容的回顧:
以ChatGPT為代表的大模型應(yīng)用開(kāi)啟了通用人工智能的新范式,其中最關(guān)鍵的技術(shù)創(chuàng)新是基于人類(lèi)反饋數(shù)據(jù)的系統(tǒng)進(jìn)行模型訓(xùn)練,從而提升了理解人類(lèi)想法的準(zhǔn)確性。
但企業(yè)在使用AI大模型時(shí)也面臨著三大挑戰(zhàn),這些挑戰(zhàn)也體現(xiàn)了GPT模型的局限性。
挑戰(zhàn)一:事實(shí)性錯(cuò)誤。事實(shí)性錯(cuò)誤(即看似正確,但與事實(shí)不符),是GPT模型的原理帶來(lái)的。GPT的模型優(yōu)化目標(biāo)是在有限的訓(xùn)練數(shù)據(jù)上泛化出無(wú)限的能力,當(dāng)問(wèn)題超過(guò)模型知識(shí)范圍時(shí),會(huì)開(kāi)始自我創(chuàng)造。事實(shí)性錯(cuò)誤的挑戰(zhàn),雖然在現(xiàn)有的技術(shù)路線下無(wú)法百分之百解決,但可以通過(guò)兩種路徑來(lái)“減弱”其影響。第一種是提升模型的知識(shí)范圍,當(dāng)模型的知識(shí)范圍越大時(shí),事實(shí)性錯(cuò)誤也就會(huì)越少。第二種是通過(guò)更好地讓模型對(duì)齊人類(lèi)的需求和價(jià)值觀,盡可能以合適的方式拒絕回答超出范圍的問(wèn)題,從而減少事實(shí)性錯(cuò)誤造成的影響。
挑戰(zhàn)二:難融入企業(yè)私域數(shù)據(jù)。像ChatGPT這樣的通用AI系統(tǒng),其能力上限是公域存量數(shù)據(jù)的范圍,因?yàn)槠髽I(yè)內(nèi)部大量的信息、知識(shí)、數(shù)據(jù)均無(wú)法被公域模型覆蓋。因此,企業(yè)內(nèi)的垂直業(yè)務(wù)需求是無(wú)法被公域模型準(zhǔn)確理解的。而企業(yè)內(nèi)的垂直業(yè)務(wù)需求是與業(yè)務(wù)流程強(qiáng)相關(guān)的,往往需要結(jié)合內(nèi)部數(shù)據(jù)作為上下文,才能準(zhǔn)確理解。例如,客戶(hù)質(zhì)量分析場(chǎng)景,企業(yè)客戶(hù)如果直接使用類(lèi)似 ChatGPT 的通用AI系統(tǒng),輸入客戶(hù)信息和對(duì)話(huà)內(nèi)容,來(lái)判定客戶(hù)是否屬于優(yōu)質(zhì)客戶(hù),那么得到的結(jié)果往往不理想。主要原因是,通用AI系統(tǒng)并不清楚企業(yè)內(nèi)部對(duì)于優(yōu)質(zhì)客戶(hù)的定義,而且不同企業(yè)對(duì)于優(yōu)質(zhì)客戶(hù)的定義很大程度上是不同的。
挑戰(zhàn)三:規(guī)模化應(yīng)用成本高。當(dāng)前,百億參數(shù)的模型輸出(推理)速度大概可以做到每個(gè)GPU每秒生成 20 個(gè)字左右(30token)。在實(shí)時(shí)文本交互(在線客服、問(wèn)答)場(chǎng)景,一個(gè)GPU支持3-5個(gè)并發(fā)客戶(hù),那么100萬(wàn)“日活躍用戶(hù)”,對(duì)應(yīng)的峰值并發(fā)約10000,需要 2000-3000個(gè)GPU,成本過(guò)于高昂。在實(shí)時(shí)語(yǔ)音交互場(chǎng)景(電話(huà)溝通、語(yǔ)音通話(huà)、視頻通話(huà))場(chǎng)景,在單個(gè)GPU單并發(fā)情況下,文本生成的句末延遲約1到3秒,疊加TTS(文本轉(zhuǎn)語(yǔ)音)的延遲,基本無(wú)法支撐需求。
過(guò)去幾年,循環(huán)智能在大模型訓(xùn)練和應(yīng)用實(shí)踐中有非常多的技術(shù)積累,為解決這些難題打下了良好的基礎(chǔ):首先,積累了大量行業(yè)文本和語(yǔ)音數(shù)據(jù),中文文本數(shù)據(jù)超過(guò)40TB,真實(shí)語(yǔ)音對(duì)話(huà)數(shù)據(jù)超過(guò) 400 萬(wàn)小時(shí);其次,具備超大規(guī)模預(yù)訓(xùn)練模型的工程化經(jīng)驗(yàn),主導(dǎo)開(kāi)發(fā)和落地了首個(gè)千億參數(shù)的中文語(yǔ)言大模型“盤(pán)古”,具備豐富的數(shù)據(jù)采集、清洗和標(biāo)注經(jīng)驗(yàn)。主導(dǎo)開(kāi)發(fā)了面向認(rèn)知的“悟道·文匯”超大規(guī)模預(yù)訓(xùn)練模型;第三,精通場(chǎng)景化的多任務(wù)指令微調(diào),在銀行、保險(xiǎn)、證券、地產(chǎn)、汽車(chē)、零售等行業(yè)有豐富的業(yè)務(wù)實(shí)踐。
今年,循環(huán)智能也將推出自研的“千循零樣本AI平臺(tái)”。“千循零樣本AI平臺(tái)”采用了多模型組合的策略,包括10億參數(shù)的盤(pán)古NLU(自然語(yǔ)言理解)模型,主要服務(wù)語(yǔ)義理解的場(chǎng)景,和面向更復(fù)雜的文本生成類(lèi)任務(wù)、參數(shù)規(guī)模更大的“千循-M”和“千循-XL”模型等。同時(shí),為了使模型更好地適配企業(yè)需求,“千循零樣本平臺(tái)”提供多種“微調(diào)”方案,包括 P-tuning、Instruction tuning、LoRA等,可以更好地融入企業(yè)的專(zhuān)有知識(shí)庫(kù)數(shù)據(jù)。
“千循零樣本AI平臺(tái)”在底層提供AI大模型的高質(zhì)量文本理解能力、邏輯推理能力和文本生成能力。基于這些能力,在企業(yè)需要對(duì)外交互的營(yíng)銷(xiāo)場(chǎng)景、服務(wù)場(chǎng)景,以及內(nèi)部的知識(shí)培訓(xùn)和內(nèi)容運(yùn)營(yíng)場(chǎng)景,提供多種創(chuàng)新應(yīng)用,幫助不同場(chǎng)景的不同角色員工提升產(chǎn)能和工作效率。
在智能化內(nèi)容運(yùn)營(yíng)與生產(chǎn)場(chǎng)景,“千循零樣本AI平臺(tái)”提供“話(huà)術(shù)質(zhì)量的分析&挖掘與優(yōu)化建議、文案自動(dòng)化生成與撰寫(xiě)、以及基于知識(shí)庫(kù)的智能問(wèn)答能力。
在客戶(hù)畫(huà)像與需求的智能分析場(chǎng)景,“千循零樣本AI平臺(tái)”提供基于對(duì)話(huà)內(nèi)容自動(dòng)識(shí)別客戶(hù)畫(huà)像與需求、基于對(duì)話(huà)內(nèi)容總結(jié)客戶(hù)所有興趣點(diǎn)&評(píng)價(jià)和提問(wèn)以及自然語(yǔ)言輸入信息,快速進(jìn)行客戶(hù)描摹能力。
在智能化業(yè)務(wù)分析與決策推薦場(chǎng)景,“千循零樣本AI平臺(tái)”提供“基于對(duì)話(huà)全文生成業(yè)務(wù)策略的能力”,在房產(chǎn)和汽車(chē)銷(xiāo)售場(chǎng)景,可以給出靠譜的商機(jī)跟進(jìn)建議。還提供“基于對(duì)話(huà)內(nèi)容評(píng)判服務(wù)效果”的能力,可以幫助企業(yè)了解客戶(hù)對(duì)售后服務(wù)是否滿(mǎn)意,以及滿(mǎn)意的地方和不滿(mǎn)意的地方分別是什么。之前企業(yè)主要是通過(guò)問(wèn)卷來(lái)收集客戶(hù)滿(mǎn)意度,填寫(xiě)問(wèn)卷的人數(shù)占比很少,現(xiàn)在可以做全量的滿(mǎn)意度分析。