日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

image.png

讓答案變得更可信,圖技術(shù)將成為大語言模型(英文:Large Language Model,縮寫LLM)發(fā)展的下一個落腳點。

回溯大模型的加速發(fā)展,需要將時間線推回到去年12月,ChatGPT在全球范圍內(nèi)現(xiàn)象級爆火。用戶側(cè)拉動市場側(cè)迅速爆發(fā),截至目前,全球已出現(xiàn)近百個大語言模型。

而當(dāng)國內(nèi)數(shù)十個大模型出現(xiàn)后,ChatGPT的關(guān)注度也在被迅速瓜分。根據(jù)SimilarWeb數(shù)據(jù),前期ChatGPT的訪問量增長率驚人,1月份的環(huán)比增長率為131.6%,后期則隨著時間的推移增長率逐漸放緩。6月份ChatGPT網(wǎng)站的全球桌面和移動流量比5月份下降了9.7%,而ChatGPT網(wǎng)站的獨立訪問量下降了5.7%。Sameweb數(shù)據(jù)顯示,訪問者在網(wǎng)站上花費的時間也下降了8.5%。

而ChatGPT的使用率逐漸降低,和其難以保證的準確率密不可分。許多用戶均在社交平臺中反饋到,目前AI聊天過程中有時會收到似乎正確但細讀卻十分荒謬的答案,又或者是微調(diào)提問的方式會得到完全不同的答案,更有甚者會提供混亂的信息,此類信息難以直觀發(fā)現(xiàn),需要一定的行業(yè)知識才能發(fā)現(xiàn)。

事實上,正確性已成為所有大語言模型在發(fā)展中不可回避的問題。尤其當(dāng)大模型需要應(yīng)用到醫(yī)療、健康、保險、銀行、金融、工業(yè)制造等行業(yè)的業(yè)務(wù)場景中時,則對容錯率的要求近乎0。因為一旦大模型提供錯誤甚至有偏差的信息,都有可能引起巨大的法律責(zé)任或公關(guān)危機。

image.png

所以,從現(xiàn)實發(fā)展看,大語言模型戰(zhàn)場的廝殺必將進入下一階段——讓答案擺脫一本正經(jīng)地胡說八道,變得100%可信。

一本正經(jīng)地胡說八道,成為大模型的最大漏洞之一

筆者咨詢大模型業(yè)內(nèi)人士后了解到:目前流行的大模型主要以GPT類模型為主流,此類模型大多為純解碼器結(jié)構(gòu),使用n-gram方法,基于參數(shù)為Θ的神經(jīng)網(wǎng)絡(luò)建模,根據(jù)前k個單詞來預(yù)測第k+1個單詞。在海量語料上的預(yù)訓(xùn)練過程中,模型可以學(xué)習(xí)到語料中的語言規(guī)律、有效信息等,從而可以在生成階段根據(jù)給定的提示輸出合理的相關(guān)信息。

但是,實際應(yīng)用過程中,大模型的“幻覺”現(xiàn)象已成為阻礙其廣泛運用的關(guān)鍵原因。

“幻覺”現(xiàn)象指模型以很高的自信輸出錯誤或不可信結(jié)果,當(dāng)模型有“幻覺”時,其使用的訓(xùn)練數(shù)據(jù)并不能證明輸出的合理性。這背后,或許和大模型復(fù)雜多樣且充滿錯誤的語料庫存在關(guān)聯(lián)。國際知名分析機構(gòu)Gartner在最新研報中指出:“ChatGPT的使用不能列出引用來源,其可靠性大多基于來源信息。但是這些來源可能本身是錯誤的、前后矛盾的。”同時,騰訊集團高級執(zhí)行副總裁湯道生在某次公開演講中也坦言道:“目前通用大模型一般都是基于廣泛的公開文獻與網(wǎng)絡(luò)信息來訓(xùn)練的,網(wǎng)上的信息可能有錯誤、有謠言、有偏見,許多專業(yè)知識與行業(yè)數(shù)據(jù)積累不足,導(dǎo)致模型的行業(yè)針對性與精準度不夠,數(shù)據(jù)噪音大。”

由此可見,解決“幻覺”現(xiàn)象成為大模型發(fā)展的關(guān)鍵門檻,尤其是對大模型的行業(yè)應(yīng)用而言,只要存在1%的偏差,都將給企業(yè)埋下風(fēng)險的種子,成為落地的門檻。

在此背景下,圖技術(shù)則有機會打破僵局,給出自己的正確答案。

讓關(guān)聯(lián)成為破局關(guān)鍵

如果說大模型是喚醒數(shù)據(jù)的一個重要“鬧鈴”,能夠讓企業(yè)的沉默數(shù)據(jù)通過分析釋放出業(yè)務(wù)價值,那么圖技術(shù)則是鬧鈴上的關(guān)鍵指針,利用結(jié)構(gòu)化且有序的數(shù)據(jù)關(guān)聯(lián)讓沉默數(shù)據(jù)釋放價值合理化,從底層賦能大語言模型變得更高效、更精準、更智能。

文中,我們首先明確圖技術(shù)的概念。圖技術(shù)以“點-邊”為數(shù)據(jù)結(jié)構(gòu)直觀簡潔地描述業(yè)務(wù)實體之間的復(fù)雜關(guān)聯(lián)關(guān)系,以復(fù)雜關(guān)聯(lián)關(guān)系的存儲、查詢、計算性能優(yōu)化為第一設(shè)計原則,能夠從圖結(jié)構(gòu)數(shù)據(jù)中挖掘出有價值的知識或規(guī)律來指導(dǎo)業(yè)務(wù)決策。

而在大模型研發(fā)和應(yīng)用過程,圖技術(shù)能夠減少幻覺的發(fā)生。

上文已經(jīng)提過大模型的應(yīng)用原理大多圍繞著 Transformer技術(shù),通過訓(xùn)練數(shù)據(jù)來凝結(jié)成泛化的知識,進而沉淀出下一個字符。但大模型無法回憶出事實,且會生成具有錯誤事實的表述。

圖技術(shù)則基于圖論,一種用于研究圖(由頂點和邊組成的數(shù)據(jù)結(jié)構(gòu))及其性質(zhì)的數(shù)學(xué)理論,通過結(jié)構(gòu)化的關(guān)聯(lián)數(shù)據(jù)進行計算和分析。當(dāng)圖技術(shù)與大模型深度融合后,能夠?qū)⒋笳Z言模型中的泛化知識抽象出來用于創(chuàng)建知識圖譜,借助數(shù)據(jù)關(guān)聯(lián)有效捕捉實體之間的關(guān)系,從而更深入推理、檢索和分析數(shù)據(jù)之間的邏輯關(guān)系,有效提升加強大模型的知識理解、精準輸出和邏輯推理能力,彌補大模型在邏輯上的漏洞,以實現(xiàn)大語言模型和其他生成式 AI 結(jié)果的準確性、可解釋性和透明性。

客觀來說,借助圖技術(shù),當(dāng)前白熱化的大模型競賽將邁進下一個里程碑。

圖技術(shù)將成下一輪大模型競賽的入場券

技術(shù)的比拼看似漫長,實則瞬息即變,入局者需要手握更多可能。放眼當(dāng)前大模型和圖技術(shù)深度結(jié)合的國際市場,我們能夠窺見一些未來。

關(guān)注國外,我們能夠發(fā)現(xiàn)海外主流的大模型均已經(jīng)開始使用圖技術(shù)來管理Context和 Prompt,并將圖的概念深度融合到預(yù)訓(xùn)練的過程當(dāng)中,使傳統(tǒng)的大模型具備更加優(yōu)秀的推理、邏輯以及可解釋的能力。據(jù)了解,圖數(shù)據(jù)庫頭部廠商Neo4j已宣布與 Google Cloud 的大語言模型Vertex AI 達成合作,企業(yè)客戶能夠利用Google Cloud Platform中的Neo4j產(chǎn)品構(gòu)建知識圖譜,以獲得更準確、透明和可解釋的生成式 AI 見解。學(xué)術(shù)領(lǐng)域,國外對于大模型與行業(yè)知識圖譜相關(guān)論文研究也處于國際前沿。

相較于國外圖技術(shù)的率先落地,國內(nèi)的大模型廠商尚未在圖技術(shù)領(lǐng)域形成大規(guī)模的投入,但是也有圖技術(shù)廠商積極探索兩者之間的技術(shù)結(jié)合和應(yīng)用落地。

圖數(shù)據(jù)庫準獨角獸創(chuàng)鄰科技憑借行業(yè)領(lǐng)先的技術(shù)理念與實踐經(jīng)驗率先發(fā)力,于2023年年初首發(fā)公布“正式接入百度文心一言能力,打造圖分析人工智能全系產(chǎn)品,以實現(xiàn)圖智能分析”。并且在近期,創(chuàng)鄰科技再度和華為最新發(fā)布的盤古大模型達成合作,共同推進圖技術(shù)和大模型的聯(lián)合發(fā)展據(jù)了解,創(chuàng)鄰科技后續(xù)將深入圖技術(shù)和各類大模型的結(jié)合,充分發(fā)揮國產(chǎn)Galaxybase圖數(shù)據(jù)庫的高性能、易擴展、實時性等優(yōu)勢,打破國內(nèi)圖技術(shù)和通用大模型與行業(yè)大模型的落地瓶頸。

總結(jié)

對于大模型而言,克服“幻覺”現(xiàn)象已成為不得不做的事,而圖技術(shù)必將成為克服該挑戰(zhàn)的關(guān)鍵因子。在大模型的角斗場里,和圖技術(shù)的結(jié)合也將成為大模型廠商新的入場券。

如果你想了解更多創(chuàng)鄰科技Galaxybase圖技術(shù)在大模型領(lǐng)域的實踐和成果,歡迎關(guān)注創(chuàng)鄰科技Galaxybase公眾號留言咨詢,我們攜手共同尋找新的大模型增長點。

分享到:
標(biāo)簽:突破口 幻覺 模型 技術(shù) 科技
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨大挑戰(zhàn)2018-06-03

數(shù)獨一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運動步數(shù)有氧達人2018-06-03

記錄運動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定