日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

AI大模型時代或已走向終局,前路未知

2022年11月30日,人工智能公司OpenAI推出了 AI 聊天機器人ChatGPT,在短短兩個月的時間里,活躍用戶數(shù)突破一億,成為史上用戶數(shù)增長最快的消費級應(yīng)用。ChatGPT成功背后是OpenAI訓(xùn)練的1750億參數(shù)模型GPT-3。一時間AI大模型迅速成為時代焦點,微軟百億美元投資OpenAI,谷歌、特斯拉、百度、阿里、小米等國內(nèi)外互聯(lián)網(wǎng)巨頭在幾個月的時間內(nèi)紛紛推出自己的AI大模型,OpenAI迅速迭代出GPT-4,幾乎每個月都至少有一家科技大公司入局訓(xùn)練大模型,人工智能成為當(dāng)前最炙手可熱的賽道。

然而就在這樣一個市場狂歡、科技巨頭紛紛“走火入模”的時刻,AI大模型的領(lǐng)軍者,OpenAI,卻給市場澆了一盆冷水。2023年4月18日在麻省理工學(xué)院的活動中,OpenAI的CEO Sam Altman在演講中警告稱:“我們已經(jīng)處在大模型時代的尾聲”,并表示如今的AIGC發(fā)展中,將數(shù)據(jù)模型進一步做大,塞進更多數(shù)據(jù)的方式,已經(jīng)是目前人工智能發(fā)展中最后一項重大進展,并且還聲稱目前還不清楚未來的發(fā)展方向何去何從。

如果拋開過熱的市場預(yù)期和浮躁的跟風(fēng)模仿去分析問題的本質(zhì),Altman對未來AI的發(fā)展方向是清晰而準(zhǔn)確的。其說法側(cè)面道出了OpenAI乃至整個AI賽道參與者目前所面臨的現(xiàn)實困境:

1.可用數(shù)據(jù)枯竭帶來的數(shù)據(jù)瓶頸

OpenAI最早的語言模式是GPT-2,于2019年公布,發(fā)布時就有 15億參數(shù),此后隨著OpenAI研究人員發(fā)現(xiàn)擴大模型參數(shù)數(shù)量能有效提升模型完善程度,真正引爆AI行業(yè)浪潮的GPT-3.5發(fā)布時,參數(shù)數(shù)量已經(jīng)達到了1750億。但人類互聯(lián)網(wǎng)歷史上被保留下來的各種高質(zhì)量語料,已經(jīng)在 GPT-3以及后續(xù)發(fā)布的GPT-4的學(xué)習(xí)中被消耗殆盡。大模型參數(shù)數(shù)量仍然可以繼續(xù)膨脹下去,但對應(yīng)數(shù)量的高質(zhì)量數(shù)據(jù)卻越來越稀缺,因此增長參數(shù)數(shù)量帶來的邊際效益愈發(fā)降低。

2.算力爆炸導(dǎo)致邊際收益遞減帶來的經(jīng)濟效益瓶頸

AI三大核心要素是數(shù)據(jù)、算法和算力,而算力的發(fā)展是最為迅速的一環(huán)。2020年OpenAI就發(fā)布分析報告,從2012年開始,AI訓(xùn)練所用的計算量呈現(xiàn)指數(shù)增長,平均每3.43個月便會翻倍,遠高于摩爾定律的18個月翻倍的速度。大模型正是在這一背景下誕生的。依托飛速發(fā)展的算力,簡單粗暴地堆砌參數(shù)是提升模型能效的捷徑。機器學(xué)習(xí)先驅(qū)Richard S. Sutton著名的文章《苦澀的教訓(xùn)》里開篇就曾說道:“70年的人工智能研究史告訴我們,充分利用計算能力的一般方法最終是最有效的方法。”OpenAI秉承這一簡單甚至原始的理念,3年內(nèi)將模型參數(shù)從15億(在當(dāng)時這已經(jīng)是一個天文數(shù)字)提高到1750億,足足拉高了116倍。

參數(shù)的爆炸式增長帶來的直接后果就是模型成本的指數(shù)級上升。2019年以前,人工智能還是個百家爭鳴的大眾賽道,而大模型帶來的投入成本門檻迅速把這個賽道變成了資本聚集、大廠統(tǒng)治的游戲。據(jù)業(yè)界估計,GPT-3僅訓(xùn)練一次的費用就高達500萬美元,行業(yè)估計GPT-4的研發(fā)加運營成本突破數(shù)億美元。

圖 1 ChatGPT回答GPT-3的訓(xùn)練費用

在如此高昂的成本之下,AI如何商業(yè)化落地成為業(yè)界難題。盡管GPT-4已經(jīng)表現(xiàn)出了較高的智能化水平,但其局限性也很明顯。支持大規(guī)模商業(yè)化應(yīng)用所需要的是GPT-X,即模型的場景化和快速更新。面對極度高昂的訓(xùn)練成本,難以形成充分的市場化競爭,類似OpenAI這樣的市場寡頭也面臨投入成本邊際效應(yīng)遞減嚴(yán)重的問題,缺乏持續(xù)研發(fā)迭代的經(jīng)濟激勵。這正是Altman所說的“大模型已至終局”而前路未知的根本原因。

3.數(shù)據(jù)合規(guī)、隱私保護、AI倫理層面的風(fēng)險不確定性

AI的道德風(fēng)險始終是行業(yè)發(fā)展中不可規(guī)避的話題。在GPT-4發(fā)布幾日內(nèi),特斯拉首席執(zhí)行官埃隆·馬斯克在內(nèi)的1748人簽署公開信,呼吁暫停訓(xùn)練比GPT-4更強大的人工智能系統(tǒng)至少6個月,以評估潛在的AI道德風(fēng)險。與此同時,專注于人工智能技術(shù)倫理的AI和數(shù)字政策中心(CAIDP)要求美國聯(lián)邦貿(mào)易委員會(FTC)調(diào)查OpenAI是否違反了消費者保護規(guī)則,認為其推出的AI文本生成工具“存在偏見、具有欺騙性,并且對公共安全構(gòu)成風(fēng)險”。3月31日,意大利國家隱私監(jiān)管機構(gòu)正式下令封禁ChatGPT,并指控OpenAI「非法收集個人數(shù)據(jù)」。 值得注意的是,該「臨時禁令」將一直生效,直到OpenAI能夠尊重歐盟具有里程碑意義的隱私法——通用數(shù)據(jù)保護條例(GDPR)。

基于價值互聯(lián)網(wǎng)的AI新時代三范式

當(dāng)一項顛覆性技術(shù)陷入瓶頸期時,往往需要另一項更加具有顛覆性的技術(shù)的介入來突破瓶頸。區(qū)塊鏈技術(shù)和人工智能作為21世紀(jì)數(shù)字化技術(shù)突破的代表,一直處于平行發(fā)展但偶爾交叉的狀態(tài)。關(guān)于區(qū)塊鏈與人工智能的結(jié)合業(yè)界多有討論,但大多只停留在表層,例如區(qū)塊鏈為AI提供分布式數(shù)據(jù)治理,AI為區(qū)塊鏈提供智能化自動執(zhí)行工具。但隨著兩項技術(shù)的快速迭代發(fā)展,各自領(lǐng)域均不斷涌現(xiàn)出突破性應(yīng)用,二者結(jié)合所帶來的想象空間其實是被遠遠低估的。

在應(yīng)用層面,區(qū)塊鏈技術(shù)發(fā)展的速度要遠遠領(lǐng)先于人工智能。它所創(chuàng)造出的最輝煌應(yīng)用,就是Web3。

圖 2 隱私和擴容技術(shù)突破加速應(yīng)用向Web3遷徙

Web3是下一代價值互聯(lián)網(wǎng)由區(qū)塊鏈特有的激勵機制打造的數(shù)字資產(chǎn)應(yīng)用為Web3賦予萬億美元經(jīng)濟價值,成為數(shù)字時代的新經(jīng)濟體。Web3是數(shù)據(jù)所有權(quán)的變革,而數(shù)據(jù)要素是AI的核心生產(chǎn)力。這一內(nèi)生聯(lián)系使區(qū)塊鏈和人工智能產(chǎn)生了巨大的交互空間,而這交互的核心就是數(shù)據(jù)要素化。

數(shù)據(jù)要素化包含確權(quán)、加工和共享三個核心環(huán)節(jié),在數(shù)據(jù)確權(quán)層面,區(qū)塊鏈提供用戶與建設(shè)者擁有并信任的互聯(lián)網(wǎng)基礎(chǔ)設(shè)施;在數(shù)據(jù)加工層面,區(qū)塊鏈構(gòu)建安全可信的價值互聯(lián)網(wǎng);在數(shù)據(jù)共享層面,區(qū)塊鏈創(chuàng)造用戶與建設(shè)者共建共享的新型經(jīng)濟系統(tǒng)。以數(shù)據(jù)為核心,區(qū)塊鏈可為AI發(fā)展提供技術(shù)底座、經(jīng)濟模型和商業(yè)化場景。在此我們提出基于價值互聯(lián)網(wǎng)的AI新時代三范式:

(一)支撐AI生產(chǎn)力的是去中心化數(shù)據(jù)基礎(chǔ)設(shè)施

數(shù)據(jù)是數(shù)字時代的生產(chǎn)要素,也是AI的核心生產(chǎn)力。OpenAI發(fā)布ChatGPT之后,百度迅速發(fā)布“文心一言”,但對比之下效果卻不甚理想。很多人說原因是GPT的語料庫是全球互聯(lián)網(wǎng),而“文心一言”的是百度知道和百度貼吧。這當(dāng)然是言過其實的調(diào)侃,但深思其背后的邏輯卻是成立的,即大模型的成功依賴于數(shù)據(jù)來源的廣度和開放度。僅從一兩個平臺獲取數(shù)據(jù)進行訓(xùn)練,必然只會做出有“偏見”的模型。

ChatGPT在這一點上做得很好,依靠互聯(lián)網(wǎng)的開放度盡可能多地收集了數(shù)據(jù),但其主要來源仍然是中心化的數(shù)據(jù)平臺,這也是Web2互聯(lián)網(wǎng)范式下的數(shù)據(jù)困境,它會在數(shù)據(jù)應(yīng)用層面帶來兩大問題:

1.數(shù)據(jù)源枯竭

依賴中心化平臺所產(chǎn)生的數(shù)據(jù)無法保證有穩(wěn)定持續(xù)的數(shù)據(jù)源來訓(xùn)練升級模型。Altman提到的互聯(lián)網(wǎng)語料已被GPT窮盡只是問題的冰山一角。更嚴(yán)重的問題是,缺少數(shù)據(jù)激勵會導(dǎo)致新的優(yōu)質(zhì)數(shù)據(jù)越來越少,甚至出現(xiàn)AI無數(shù)據(jù)可用的問題。

讓我們想象這樣一個場景。如果說ChatGPT逐漸完善成為唯一的知識平臺,Quora、Stackoverflow、知乎等一眾知識平臺必將失去生存空間,而它們卻又是ChatGPT訓(xùn)練的主要數(shù)據(jù)來源,那未來的ChatGPT又要用什么數(shù)據(jù)來訓(xùn)練呢?

2.數(shù)據(jù)質(zhì)量低下

對于AI來說,平臺有自己的應(yīng)用場景,不會考慮AI訓(xùn)練的需求。平臺不會對所謂的“數(shù)據(jù)質(zhì)量”做審核,例如知乎上分享的不一定是知識,也可能是剛編的故事。同時根據(jù)不同平臺的使用人群不同還會產(chǎn)生內(nèi)容偏見。這也是為什么ChatGPT經(jīng)常會給出一些明顯錯誤甚至荒謬的回答。

圖 3 ChatGPT經(jīng)典荒謬回答之“林黛玉倒拔垂楊柳”

以上問題的核心是平臺數(shù)據(jù)并沒有完成數(shù)據(jù)要素化。用戶作為數(shù)據(jù)的生產(chǎn)者無法對數(shù)據(jù)進行確權(quán),導(dǎo)致數(shù)據(jù)全部歸平臺所有;平臺作為數(shù)據(jù)的加工者缺乏激勵,不會對數(shù)據(jù)進行應(yīng)有的加工;模型公司作為數(shù)據(jù)的使用者與數(shù)據(jù)生產(chǎn)加工環(huán)節(jié)嚴(yán)重割裂。而去中心化數(shù)據(jù)基礎(chǔ)設(shè)施正是這些問題的解決方案。

在《區(qū)塊鏈托管重塑數(shù)據(jù)要素權(quán)益分配機制》一文中,我們提到了Web3是數(shù)據(jù)要素革命,是數(shù)據(jù)主權(quán)的“還數(shù)于民”。在AI新時代里,去中心化數(shù)據(jù)基礎(chǔ)設(shè)施將為AI模型提供全生命周期數(shù)據(jù)解決方案,包括:

(1)數(shù)據(jù)確權(quán):用戶數(shù)據(jù)通過自主數(shù)字身份確權(quán),數(shù)據(jù)生產(chǎn)者直接參與模型建設(shè)周期并獲得對等激勵;

(2)數(shù)據(jù)加工:數(shù)據(jù)加工者(例如模型數(shù)據(jù)標(biāo)注、數(shù)據(jù)質(zhì)量評價)通過去中心化數(shù)據(jù)基礎(chǔ)設(shè)施參與模型建設(shè)并獲得對等激勵;

(3)數(shù)據(jù)共享:數(shù)據(jù)生產(chǎn)者通過去中心化數(shù)據(jù)托管共享數(shù)據(jù)給數(shù)據(jù)使用者(例如建模公司),建模公司可以通過智能合約自動化數(shù)據(jù)獲取和建模流程,實現(xiàn)快速模型升級。

(二)支撐AI商業(yè)化的是DataFi

Web3的成功在于區(qū)塊鏈技術(shù)所提供的優(yōu)秀激勵模型和可持續(xù)的經(jīng)濟系統(tǒng)。去中心化金融(DeFi)已經(jīng)創(chuàng)造出了繁榮的數(shù)字經(jīng)濟生態(tài)和萬億美元的市場價值,以數(shù)據(jù)資產(chǎn)為核心的數(shù)據(jù)金融(DataFi)將成為支撐AI商業(yè)化的全新商業(yè)模式。

在DataFi中,數(shù)據(jù)作為生產(chǎn)要素會實現(xiàn)通證化。數(shù)據(jù)的產(chǎn)生、加工、存儲和使用都會依照去中心化經(jīng)濟模型自主產(chǎn)生或消耗數(shù)據(jù)資產(chǎn)通證。數(shù)據(jù)循環(huán)會被充分激勵并產(chǎn)生凈價值。AI模型的全生命周期都會以一種更加分布式的形式呈現(xiàn),包括去中心化算力供應(yīng)商、去中心化數(shù)據(jù)標(biāo)注和基于去中心化數(shù)據(jù)基礎(chǔ)設(shè)施的數(shù)據(jù)托管服務(wù)商。模型訓(xùn)練不再具有高門檻。

在DataFi中,數(shù)據(jù)通證會創(chuàng)造出以數(shù)據(jù)資產(chǎn)為核心的衍生品交易市場。AI生態(tài)參與方可以充分挖掘自身的數(shù)據(jù)價值或服務(wù)價值,參與以數(shù)據(jù)資產(chǎn)為核心的金融衍生品交易、質(zhì)押、抵押貸款等創(chuàng)新金融服務(wù)。數(shù)據(jù)資產(chǎn)的使用效率得到充分釋放。

(三)支撐AI規(guī)范性的是分布式數(shù)字身份

除了上文提到的數(shù)據(jù)確權(quán),分布式數(shù)字身份也將成為支撐AI合規(guī)發(fā)展的關(guān)鍵監(jiān)管技術(shù)。分布式數(shù)字身份為用戶賦予了數(shù)據(jù)自主權(quán),打破數(shù)據(jù)控制者對數(shù)據(jù)的天然壟斷,也提升了用戶在算法面前的自主權(quán)。在AI新時代中,分布式數(shù)字身份包含三個主要應(yīng)用場景:

1.用戶分布式數(shù)字身份

用戶通過分布式數(shù)字身份參與AI構(gòu)建周期,通過數(shù)據(jù)確權(quán)和自主數(shù)據(jù)主權(quán)保護數(shù)據(jù)隱私,并實現(xiàn)對等數(shù)據(jù)激勵。在合規(guī)層面,通過分布式數(shù)字身份為用戶提供了100%的數(shù)據(jù)主權(quán),用戶對自己的隱私數(shù)據(jù)擁有完全控制權(quán),能夠自主決定數(shù)據(jù)的披露對象和使用場景,并且結(jié)合零知識證明等技術(shù),實現(xiàn)最小化隱私披露,天然符合《數(shù)據(jù)安全法》《個保法》的相關(guān)規(guī)定。通過將個人作為數(shù)據(jù)共享的載體,是《個保法》中個人信息可攜帶權(quán)的體現(xiàn),結(jié)合自主身份使得個人數(shù)據(jù)可以遵從本人意愿向數(shù)據(jù)使用方(例如建模公司),嚴(yán)格符合GDPR等國際數(shù)據(jù)共享法律法規(guī)。

2.模型分布式數(shù)字身份

在AI新時代中,模型獨立且唯一的數(shù)字身份。用戶可以通過數(shù)字身份像選擇商品一樣選擇模型,并且通過模型數(shù)字身份解決使用量證明、版權(quán)糾紛和版本管理等問題。

3.數(shù)字人和AIGC分布式數(shù)字身份

對于AI構(gòu)建出來的實體(例如數(shù)字人)頒發(fā)唯一數(shù)字身份,并在法律層面規(guī)范其標(biāo)準(zhǔn)與權(quán)利范圍,實現(xiàn)AI的合規(guī)和可控。

基于分布式技術(shù)的強AI時代藍圖

理查德·費曼(Richard Feynman)在1985年的一次講座中第一次提出了“強人工智能”的概念,為我們描繪了一個全知全能的AI時代。后世人們不斷討論這個概念,但對強AI的具體定義和未來圖景眾說紛紜。斯蒂芬·霍金將強AI稱為對人類的最大威脅,馬斯克稱研究強AI就是在“召喚魔鬼”,但人類仍然對它趨之若鶩。有人說是因為結(jié)束人工智能研究則意味著放棄了改善人類狀況的機會,也就是使人類文明更加美好或者維持下去的機會。那么如果采用了區(qū)塊鏈技術(shù),強AI時代藍圖會有什么不同?

強AI時代不是指一個全知全能的AI出現(xiàn),而是無數(shù)個AI的產(chǎn)業(yè)大繁榮。區(qū)塊鏈?zhǔn)巩a(chǎn)業(yè)高度去中心化,每一個個人都可以同時成為模型的使用者和訓(xùn)練方。每一個模型都擁有自己的數(shù)字身份,高度智能也相互獨立。模型的使用場景高度細化,使用方式由智能合約定義。

強AI時代模型訓(xùn)練成本極低而迭代速度極快。通過去中心化網(wǎng)絡(luò)串聯(lián)模型全生命周期參與方,數(shù)據(jù)使用效率達到極致。在很多業(yè)務(wù)場景,模型可以根據(jù)實時業(yè)務(wù)需求實現(xiàn)毫秒級生成和毫秒級迭代,一次性模型成為可能,“模型流”成為模型主流應(yīng)用方式。

強AI時代控制權(quán)通過數(shù)據(jù)綁定在人類手中。Web3實現(xiàn)數(shù)據(jù)自主擁有,AI可以自迭代算法,但數(shù)據(jù)所有權(quán)牢牢掌握在人類手中。“AI控制人類”的末世傳說不會實現(xiàn)。

分享到:
標(biāo)簽:區(qū)塊 人工智能 變量 開啟 關(guān)鍵 時代 汪德嘉
用戶無頭像

網(wǎng)友整理

注冊時間:

網(wǎng)站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨大挑戰(zhàn)2018-06-03

數(shù)獨一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運動步數(shù)有氧達人2018-06-03

記錄運動步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定