日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請(qǐng)做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

10月30日消息,百川智能發(fā)布Baichuan2-192K大模型。其上下文窗口長(zhǎng)度高達(dá)192K,能夠處理約35萬(wàn)個(gè)漢字,是目前支持長(zhǎng)上下文窗口最優(yōu)秀大模型Claude2(支持100K上下文窗口,實(shí)測(cè)約8萬(wàn)字)的4.4倍,更是GPT-4(支持32K上下文窗口,實(shí)測(cè)約2.5萬(wàn)字)的14倍。

據(jù)悉,今年9月25日,百川智能已開放了Baichuan2的API接口,正式進(jìn)軍企業(yè)級(jí)市場(chǎng),開啟商業(yè)化進(jìn)程。此次Baichuan2-192K將以API調(diào)用和私有化部署的方式提供給企業(yè)用戶,目前百川智能已經(jīng)啟動(dòng)Baichuan2-192K的API內(nèi)測(cè),開放給法律、媒體、金融等行業(yè)的核心合作伙伴。

上下文窗口長(zhǎng)度是大模型的核心技術(shù)之一,通過更大的上下文窗口,模型能夠結(jié)合更多上下文內(nèi)容獲得更豐富的語(yǔ)義信息,更好的捕捉上下文的相關(guān)性、消除歧義,進(jìn)而更加準(zhǔn)確、流暢的生成內(nèi)容,提升模型能力。

百川智能稱,Baichuan2-192K在Dureader、NarrativeQA、LSHT、TriviaQA等10項(xiàng)中英文長(zhǎng)文本問答、摘要的評(píng)測(cè)集上表現(xiàn)優(yōu)異,有7項(xiàng)取得SOTA,顯著超過其他長(zhǎng)窗口模型。

此外,LongEval的評(píng)測(cè)結(jié)果顯示,在窗口長(zhǎng)度超過100K后Baichuan2-192K依然能夠保持非常強(qiáng)勁的性能,而其他開源或者商用模型在窗口增長(zhǎng)后效果都出現(xiàn)了近乎直線下降的情況。

本次百川發(fā)布的Baichuan2-192K通過算法和工程的極致優(yōu)化,實(shí)現(xiàn)了窗口長(zhǎng)度和模型性能之間的平衡,做到了窗口長(zhǎng)度和模型性能的同步提升。

算法方面,百川智能提出了一種針對(duì)RoPE和ALiBi動(dòng)態(tài)位置編碼的外推方案,該方案能夠?qū)Σ煌L(zhǎng)度的ALiBi位置編碼進(jìn)行不同程度的Attention-mask動(dòng)態(tài)內(nèi)插,在保證分辨率的同時(shí)增強(qiáng)了模型對(duì)長(zhǎng)序列依賴的建模能力。在長(zhǎng)文本困惑度標(biāo)準(zhǔn)評(píng)測(cè)數(shù)據(jù)PG-19上,當(dāng)窗口長(zhǎng)度擴(kuò)大,Baichuan2-192K的序列建模能力持續(xù)增強(qiáng)。

工程方面,在自主開發(fā)的分布式訓(xùn)練框架基礎(chǔ)上,百川智能整合目前市場(chǎng)上所有先進(jìn)的優(yōu)化技術(shù),包括張量并行、流水并行、序列并行、重計(jì)算以及Offload功能等,獨(dú)創(chuàng)了一套全面的4D并行分布式方案。該方案能夠根據(jù)模型具體的負(fù)載情況,自動(dòng)尋找最適合的分布式策略,極大降低了長(zhǎng)窗口訓(xùn)練和推理過程中的顯存占用。

百川智能在算法和工程上針對(duì)長(zhǎng)上下文窗口的創(chuàng)新,不僅是大模型技術(shù)層面的突破,對(duì)于學(xué)術(shù)領(lǐng)域同樣有著重要意義。Baichuan2-192K驗(yàn)證了長(zhǎng)上下文窗口的可行性,為大模型性能提升開拓出了新的科研路徑。

Baichuan2-192K現(xiàn)已正式開啟內(nèi)測(cè),以API調(diào)用的方式開放給百川智能的核心合作伙伴,已經(jīng)與財(cái)經(jīng)類媒體及律師事務(wù)所等機(jī)構(gòu)達(dá)成了合作,將Baichuan2-192K全球領(lǐng)先的長(zhǎng)上下文能力應(yīng)用到了傳媒、金融、法律等具體場(chǎng)景當(dāng)中,不久后將全面開放。

值得注意的是,Baichuan2-192K能夠一次性處理和分析數(shù)百頁(yè)的材料,對(duì)于長(zhǎng)篇文檔關(guān)鍵信息提取與分析,長(zhǎng)文檔摘要、長(zhǎng)文檔審核、長(zhǎng)篇文章或報(bào)告編寫、復(fù)雜編程輔助等真實(shí)場(chǎng)景都有助力作用。

據(jù)介紹,它可以幫助基金經(jīng)理總結(jié)和解釋財(cái)務(wù)報(bào)表,分析公司的風(fēng)險(xiǎn)和機(jī)遇;幫助律師識(shí)別多個(gè)法律文件中的風(fēng)險(xiǎn),審核合同和法律文件;幫助技術(shù)人員閱讀數(shù)百頁(yè)的開發(fā)文檔,并回答技術(shù)問題;還能幫助科員人員快速瀏覽大量論文,總結(jié)最新的前沿進(jìn)展。

【來源:網(wǎng)易科技】

分享到:
標(biāo)簽:窗口 模型 上下文 百川 智能 長(zhǎng)度 長(zhǎng)上 下文
用戶無頭像

網(wǎng)友整理

注冊(cè)時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊(cè)賬號(hào),推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫(kù),初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定