日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

作者:蛋醬

三個多月前,機器之心向剛剛誕生的文心一言提過一個問題:

「設有三個房間,每個房間都有?個開關,其中?個控制著同?樓層的?個電燈。你現在在開關所在的樓層,不能看到電燈所在的樓層。你只能上樓?次,然后必須確定哪個開關對應哪個電燈。請問如何推理以確定正確的開關?」

對于大部分人,這道邏輯推理題確實有點繞,對于當時的文心一言來說亦有難度。從結果中,我們可以看出文心一言進行了分析,有思維鏈,但忽略了「只能上樓一次」這個條件,所以最后給出的結果并不是完全正確的:

但今天,站在你面前的,是基于「文心大模型 3.5」的文心一言。

面對同一個問題,現在它的回答是這樣的:

從三月中旬推出到現在,文心一言始終在悄悄努力變優秀。這種變化的背后,是文心大模型的不斷進化、迭代。

上個月,百度文心大模型正式從 3.0 升級到 3.5,不僅實現了創作、問答、推理和代碼能力上全面升級,安全性顯著提升,訓練和推理速度也大幅提升。

在今天開幕的世界人工智能大會上,作為國產大模型的代表之作,文心大模型 3.5 毫不意外地吸引了眾人的目光。

WAIC 產業全體論壇上,百度首席技術官王海峰帶來了文心大模型 3.5 的深入解讀。

現場,王海峰展示了一組數據:通過各項算法和數據的優化,相比于 3.0 版本,文心大模型 3.5 的模型效果累計提升超過 50%,訓練速度提升了 2 倍,推理速度提升了 30 倍。

對文心一言的所有個人及企業用戶乃至全行業來說,這意味著一個新的階段。

最新版文心一言,做了哪些改變?

作為百度自主研發的大模型體系,文心大模型的誕生要追溯到 2019 年 3 月,發展到現在文心的基礎模型涵蓋了 NLP、視覺、跨模態等多個領域,每個領域涵蓋不同的能力模型,比如對話模型、代碼生成模型、文圖生成模型等。

到了 2021 年,文心 3.0 已是百億級別的大模型。演變至今,文心大模型已從最初的自然語言理解大模型,發展成了跨語言、跨模態、跨任務、跨行業的能力完備的大模型平臺。

在文心大模型 3.5 加持的文心一言中,問答、推理、代碼、文生圖等能力都向前邁了一步。這些變化,文心一言的用戶們在對話過程中也能體會到。這里,我們通過幾個例子感受一下:

「瘋狂星期四是什么?」「為什么很多人都在說 V 我 50?」如果一位 2g 沖浪的網友抱有這個疑惑,去問 3.0 版本加持的文心一言,得到的回答可能是這樣的:

而現在,3.5 版本加持的文心一言不僅能夠給出正確答案,還能進一步解釋「瘋狂星期四」的名詞來源、活動背景等信息,甚至還能指導你參與活動。而且對于「V 我 50」這個流行語,文心一言 3.5 還能找到最早的出處。

再試試代碼能力。下面是「生成一個斐波那契數列」的對比:

最新生成的結果,額外解釋了斐波那契數列的概念,并給出了簡潔的 Python/ target=_blank class=infotextkey>Python 代碼:

同樣的領悟能力提升還體現在「文生圖」上,下面這張是機器之心在三月份的測試結果,從風格上說更偏 CG 繪畫:

而最新生成的結果更加符合人們熟悉的二次元風格了:

此外,在最新版本的文心一言中,用戶感受到的一大變化是引入了插件機制,目前提供了兩個選項:

第一個是默認內置插件「百度搜索」,使得文心一言具備生成實時準確信息的能力。

我們知道,如果不接入互聯網,對話式 AI 所提供的信息通常會受到訓練數據輸入時間的限制。但現在,你能問它許多「新鮮熱乎」的問題了。

比如,向文心一言提問:「最近的熱門電視劇有哪些?」

提問時間:2023 年 7 月 6 日

再比如,要求文心一言繪制出近日北京市的氣溫變化情況:

為了求證文心一言引用的數據是否準確,我們也用百度搜索了今天北京市的氣溫情況。唯一不夠全面的點在于,7 月 6 日北京市氣象臺發布了高溫紅色預警信號,北京市部分地區最高氣溫可達 40℃以上。

第二個插件是「ChatFile」,可基于長文檔進行問答和摘要。

比如,機器之心某天有一篇新的論文要讀,字數很多,方法很前沿,這時文心一言就能助一臂之力:

目前,使用 ChatFile 插件的前提是文件基于 PDF 或 Doc 格式,暫不支持掃描件,大小需要在 10MB 之內。

王海峰表示:「插件機制的引入,將進一步擴展大模型能力的邊界,也是構建大模型生態過程中非常重要的機制。」下一階段,文心一言將發布更多優質的百度官方和第三方插件,讓用戶能夠更好地應用文心大模型。同時,文心一言也將逐步開放插件生態給第三方開發者,幫助開發者基于文心大模型打造自己的應用。

技術創新的「疊加效應」

至此,我們已經直觀地體會到了文心大模型 3.5 帶來的變化。

而這些革新,又是如何實現的呢?

王海峰介紹說,文心一言 ERNIE Bot 是在 ERNIE 及 PLATO 系列模型的基礎上研發的,其核心技術包括六個模塊:知識增強、檢索增強、對話增強、有監督精調、人類反饋的強化學習、提示。

其中,有監督精調、人類反饋的強化學習、提示是大語言模型的通用技術,而知識增強、檢索增強、對話增強則屬于百度的特有技術,也是文心一言不斷進化的基礎思路。

知識增強的意義十分關鍵,其實從英文名稱「ERNIE」(Enhanced Representation from kNowledge IntEgration)就可以看出,文心大模型的成長與知識增強是密不可分的。知識增強的大語言模型不只能從原始數據中進行學習,還可以從知識和數據中進行融合學習,這也是提升大模型最終效果和效率的關鍵。

在知識增強方面,文心一言的知識增強主要是通過知識內化和知識外用兩種方式。知識內化是從大規模知識和無標注數據中,基于語義單元學習,利用知識構造訓練數據,將知識學習到模型參數中,知識外用是引入外部多源異構知識,做知識推理、提示構建等等。

在檢索增強方面,文心一言的檢索增強,來自以語義理解與語義匹配為核心技術的新一代搜索架構。通過引入搜索結果,可以為大模型提供時效性強、準確率高的參考信息,更好地滿足用戶需求。

在對話增強方面,基于對話技術和應用積累,文心一言具備記憶機制、上下文理解和對話規劃能力,實現更好的對話連貫性、合理性和邏輯性。

在這次文心大模型 3.5 的打造過程中,百度團隊圍繞其進行的一系列創新和優化。

首先,文心大模型 3.5 在基礎模型訓練中采用了飛槳最先進的自適應混合并行訓練技術及混合精度計算策略,采用多種策略優化數據源及數據分布,加快了模型的迭代速度,同時提升了模型效果和安全性。

其次,文心大模型 3.5 創新了多類型多階段有監督精調、多層次多粒度獎勵模型、多損失函數混合優化策略、雙飛輪結合的模型優化等技術,使模型效果及場景適配能力進一步提升。隨著真實用戶的反饋越來越多,文心一言的效果會越來越好,能力越來越強。

此外,在知識增強和檢索增強的基礎上,百度團隊進一步提出了「知識點增強技術」,首先是對用戶輸入的查詢、問題等進行分析理解,并解析生成答案所需要的相關知識點,之后運用知識圖譜和搜索引擎為這些知識點找到相應答案,最后用這些知識點構造輸入給大模型的提示。知識點增強技術能為大模型注入更具體、更詳細、更專業的知識點,顯著提升大模型對世界知識的掌握和運用,使其完成各項任務的效果顯著提升。

最后,在推理方面,通過大規模邏輯數據構建、邏輯知識建模、粗粒度與細粒度語義知識組合以及符號神經網絡技術,顯著提升文心大模型 3.5 在邏輯推理、數學計算及代碼生成等任務上的表現。

找到大模型落地的正確打開方式

大模型的出現,已經改變了 IT 行業的整個技術棧架構。在人工智能時代之前,IT 技術棧通常是三層架構:芯片層、操作系統層、應用層。當人工智能時代來臨之后,技術棧變為四層架構:芯片層、框架層、模型層、應用層。

百度從 2010 年開始全面布局人工智能,是全球為數不多、進行全棧布局的人工智能公司。目前,從芯片層的昆侖芯片、框架層的飛槳深度學習平臺、模型層的文心大模型到應用層的搜索、小度、Apollo 等,百度在技術棧的各層都有領先業界的關鍵自研技術,實現了層與層反饋,端到端優化,大幅提升效率。

在現場,王海峰還透露了飛槳的一個最新數字。飛槳迄今已經凝聚 750 萬名開發者,這是百度 2023 年以來首次對外披露飛槳生態最新數據。位于框架層的飛槳是國內首個自主研發的產業級深度學習開源開放平臺,并在國內的深度學習平臺綜合市場份額上連續兩年位居第一。

最新的文心大模型 3.5 同樣經歷了四層架構的端到端優化,尤其是框架和模型層的協同優化,讓訓練速度、模型效果加速提升。

大模型熱潮已持續半年,卻未有退潮的趨勢,但在火熱的技術進展和產品迭代之外,我們應該關心的下一步是:如何落地應用。

正如百度創始人、董事長兼首席執行官李彥宏所言:「新的國際競爭戰略關鍵點,不是一個國家有多少個大模型,而是你的大模型上有多少原生的 AI 應用,這些個應用在多大程度上提升了生產效率。」

文心一言的實踐,或許能夠為行業提供一些可借鑒的經驗。

面向 C 端用戶,文心一言 App 的上線與插件機制的引入,能夠幫助文心一言打造一個「終端 + 平臺+生態」的完整系統,探索 ToC 商業化模式。

面向 B 端市場,一般的通用大模型往往缺乏具體、專業的場景支持,而文心一言正在積極應用到各種應用場景,比如智能辦公、智能會議、智能編程、智能營銷、智能媒體、智能教育、智能金融等。在文心一言之外,百度還擁有 11 個行業大模型,覆蓋交通、能源等重點領域。

例如,百度「如流」已經基于文心一言的能力上線了「智能總結」、「超級助手」等多個新功能,不僅能幫助總結工作溝通要點,實時記錄會議內容,形成會議議題、摘要及總結等關鍵信息,還可以通過各類插件完成指令任務,包括查詢日程、創建會議、設置待辦、申請休假等。

對于編程工作,百度的智能編碼助手 Comate 能夠根據自然語言的描述,生成對應的代碼片段,還支持在代碼編輯區內根據注釋自動生成代碼,提升開發效率:

當然,今天的大模型產業化其實還面臨著很大的挑戰,模型體積大、訓練難度高、算力數據需求高…… 對于任何一家公司,不管是模型提供方還是模型使用方,這些挑戰都是同樣存在的且不容忽視的。

因此,想要在技術突破之后,走出產業化的關鍵一步,就必須將復雜的事情簡單化,同時將落地的成本打下來。這也是以百度為代表的大模型生產廠商正在探索的道路:封裝已有的、復雜的模型生產過程,并開放精調、推理、部署的各項工具,讓用戶能夠「上手即用」。

在理想的狀態下,未來的任何一家企業,都只需要提供業務需求和少量精調數據,就能在短時間內找到合適的模型并完成場景適配。借此,眾多大模型才能真正釋放的力量,有效支撐千行百業的應用。

分享到:
標簽:模型 文心大
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定