日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:52003
  • 待審:43
  • 小程序:12
  • 文章:1047590
  • 會(huì)員:762

【ITBEAR科技資訊】4月13日消息,360公司近日在GitHub上公開了其360智腦7B(70億參數(shù)模型),這一大模型是基于3.4萬億Tokens的語料庫進(jìn)行訓(xùn)練的,主要涵蓋了中文、英文和代碼。該模型提供了4K、32K、360K三種不同的文本長度選項(xiàng),其中360K(大約50萬字)被360自稱為當(dāng)前國內(nèi)開源模型中最長的文本長度。

360在多個(gè)主流評(píng)測數(shù)據(jù)集上,包括C-eval、AGIeval、MMLU、CMMLU、HellaSwag、MATH、GSM8K、Humaneval、MBPP、BBH以及LAMBADA,對(duì)其模型性能進(jìn)行了全面驗(yàn)證。這些評(píng)測主要考察了模型的自然語言理解、知識(shí)儲(chǔ)備、數(shù)學(xué)計(jì)算和推理、代碼生成以及邏輯推理等能力。結(jié)果顯示,360模型在四個(gè)評(píng)測數(shù)據(jù)集上取得了領(lǐng)先的排名,整體平均成績位列第三。

在專門為大語言模型設(shè)計(jì)的長文本理解能力評(píng)測基準(zhǔn)LongBench中,360選擇了與中文長文本應(yīng)用最為相關(guān)的任務(wù)進(jìn)行測試。結(jié)果顯示,360Zhinao-7B-Chat-32K模型在中文單文檔問答、多文檔問答、摘要以及Few-shot等任務(wù)中取得了平均第一的好成績。

同時(shí),在英文大海撈針測試以及360自行構(gòu)造的中文大海撈針測試中,360Zhinao-7B-Chat-360K模型均達(dá)到了98%以上的準(zhǔn)確率,顯示出優(yōu)異的長文本處理能力。

除了模型權(quán)重之外,360還開源了該模型的微調(diào)訓(xùn)練代碼和推理代碼等全套工具集,使得大模型相關(guān)開發(fā)者能夠非常方便地使用這些資源,實(shí)現(xiàn)“開箱即用”。

據(jù)ITBEAR科技資訊了解,360公司董事長周鴻祎曾表示,大模型行業(yè)在文本長度上有所追求,100萬字將很快成為行業(yè)的標(biāo)配。他透露,360之所以將模型文本長度定為360K,并選擇開源這一能力,是為了讓整個(gè)行業(yè)能夠共享這一成果,避免重復(fù)勞動(dòng)。周鴻祎自稱是“開源的信徒”,堅(jiān)信開源能夠推動(dòng)行業(yè)的進(jìn)步。

分享到:
標(biāo)簽:開源 萬字 模型 文本 能力
用戶無頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 52003

    網(wǎng)站

  • 12

    小程序

  • 1047590

    文章

  • 762

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績?cè)u(píng)定