出品 | OSC開源社區(ID:oschina2013)
小米 AI 大模型 MiLM-6B 首次曝光。
MiLM-6B 是由小米開發的一個大規模預訓練語言模型,參數規模為 64 億。在 C-Eval 和 CMMLU 上均取得同尺寸最好的效果。
根據 C-Eval 給出的信息,MiLM-6B 模型在具體各科目成績上,在 STEM(科學、技術、工程和數學教育)全部 20 個科目中,計量師、物理、化學、生物等多個項目獲得了較高的準確率。
據悉,MiLM-6B 模型目前已經在大多數文科科目中表現出了相對良好的準確度,不過在 “法學、數學、編程、概率論、離散數學” 等涉及 “抽象思維” 的科目中,還有一定進步空間。
在 10 個 “社會科學” 測試科目中,除 “教育學和地理” 外,該模型在其他 8 個科目中都獲得了較為理想的準確率。在人文科學的 11 個科目中,MiLM-6B 則在 “歷史與法律” 基礎上有著不錯的準確率表現。
雖然小米 AI 大模型 MiLM-6B 當下才首次曝光,不過完成度已經較高,在未來該模型可能會被用于小米旗下 “小愛同學” 等虛擬助理服務中。
相關鏈接:https://Github.com/XiaoMi/MiLM-6B
END