波多野结衣 蜜桃视频,国产在线精品露脸ponn,a v麻豆成人,AV在线免费小电影

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:52003
  • 待審:43
  • 小程序:12
  • 文章:1047590
  • 會員:762

Llama 3發布剛幾天,微軟就出手截胡了?

今天發布的Phi-3系列小模型技術報告,引起AI圈熱議。

其中僅3.8B參數的Phi-3-mini在多項基準測試中超過了Llama 3 8B。

為了方便開源社區使用,還特意設計成了與Llama系列兼容的結構。

微軟這次打出“手機就能直接跑的小模型”的旗號,4bit量化后的phi-3-mini在iphone 14 pro和iPhone 15使用的蘋果A16芯片上跑到每秒12 token。

這意味著,現在手機上能本地運行的最佳開源模型,已經做到ChatGPT水平。

在技術報告中還玩了一把花活,讓phi-3-mini自己解釋為什么構建小到手機能跑的模型很令人驚嘆。

除了mini杯之外,小杯中杯也一并發布:

Phi-3-small,7B參數,為支持多語言換用了TikToken分詞器,并額外增加10%多語種數據。

Phi-3-medium,14B參數,在更多數據上訓練,多數測試中已超越GPT-3.5和Mixtral 8x7b MoE。

作者陣容一看也不簡單,一眼掃過去MSRA和MSR雷蒙德團隊都投入了不少人。

那么,Phi-3系列到底有什么獨特之處呢?

根據技術報告中披露,其核心秘訣就在于數據。

去年團隊就發現,單純堆砌參數量并不是提升模型性能的唯一路徑。

反而是精心設計訓練數據,尤其是利用大語言模型本身去生成合成數據,配合嚴格過濾的高質量數據,反而能讓中小模型的能力大幅躍升。

也就是訓練階段只接觸教科書級別的高質量數據,Textbooks are all you need。

Phi-3也延續了這一思路,這次他們更是下了血本:

  • 投喂了多達3.3萬億token的訓練數據(medium中杯是4.8萬億);

  • 大幅強化了數據的“教育水平”過濾;

  • 更多樣化的合成數據,涵蓋邏輯推理、知識問答等多種技能;

  • 獨特的指令微調和RLHF訓練,大幅提升對話和安全性。

舉個例子,比如某一天足球比賽的結果可能對于大模型是良好的訓練數據,但微軟團隊刪除了這些加強知識的數據,留下更多能提高模型推理能力的數據。

這樣一來,對比Llama-2系列,就可以用更小的參數獲得更高的MMLU測試分數了。

不過小模型畢竟是小模型,也不可避免存在一些弱點。

微軟透露,模型本身參數中沒能力存儲太多事實和知識,這一點也可以從TriviaQA測試分數低看出來。

緩解辦法就是聯網接入搜索引擎增強。

總之,微軟研究院團隊是鐵了心了要在小模型+數據工程這條路上走下去,未來還打算繼續增強小模型的多語言能力、安全性等指標。

對于開源小模型超過ChatGPT這回事,不少網友都認為壓力現在給到OpenAI這邊,需要趕快推出GPT-3.5的繼任者了。

參考鏈接:  [1]https://arxiv.org/abs/2404.14219

分享到:
標簽:微軟
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 52003

    網站

  • 12

    小程序

  • 1047590

    文章

  • 762

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定