日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

4 月 4 日消息,OpenAI 最新的語言模型 GPT-4 不僅能夠像人類一樣生成各種文本,還能夠設計和執行測試來評估和改進自己的表現。這種“反思”技術讓 GPT-4 在多項難度較高的測試中,都取得了顯著的進步,測試表現提升 30%。

GPT-4 是繼 GPT、GPT-2 和 GPT-3 之后,OpenAI 推出的最先進的系統,也是目前最大的多模態模型(可以接受圖像和文本輸入,輸出文本)。其利用深度學習技術,使用人工神經網絡來模仿人類的寫作。

研究人員諾亞?辛恩(Noah Shinn)和阿什溫?戈平納特(Ashwin Gopinath)在論文中寫道:“我們開發了一種新穎的技術,讓 AI 代理能夠模擬人類的自我反思,并評估自己的表現。GPT-4 在完成各種測試的時候,會增加一些額外的步驟,讓它能夠自己設計測試來檢查自己的答案,找出錯誤和不足之處,然后根據發現來修改自己的解決方案。”

在 HumanEval 編碼測試中,GPT-4 使用自我反思環路,準確率從 67% 上升到 88%

GPT-4 可以通過設計和執行測試來批判其自身的性能,如 AlfWorld 測試結果所示,可以大大改善其性能

研究團隊使用這種技術對 GPT-4 進行了幾種不同的性能測試。在 HumanEval 測試中,GPT-4 需要解決 164 個從未見過的 Python 編程問題,原本準確率為 67%,使用反思技術后,準確率提升到了 88%。在 Alfworld 測試中,AI 需要在各種不同的交互環境中,通過執行一些允許的操作,來做出決策和解決多步任務。使用反思技術后,GPT-4 的準確率從 73% 提高到了 97%,只有 4 個任務失敗。在 HotPotQA 測試中,GPT-4 可以訪問維基百科,并回答 100 個需要從多個支持文檔中解析內容和推理的問題,原本準確率為 34%,使用反思技術后,準確率提高到了 54%。

這項研究表明,AI 問題的解決方案有時候是依賴 AI 本身。IT之家發現,這有點像生成對抗網絡,這是一種讓兩個 AI 互相提高技能的方法,比如一個 AI 試圖生成一些看起來像真實圖片的圖片,另一個 AI 試圖分辨哪些是假的,哪些是真的。但在這種情況下,GPT 既是寫作者又是編輯,通過自我反思來改進自己的輸出質量。

【來源:IT之家】

分享到:
標簽:自己的 反思 技術 準確率 測試 測試中 之家 微軟
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定