速途網(wǎng)訊 通義千問(wèn)開(kāi)源!8月3日,AI模型社區(qū)魔搭ModelScope上架兩款開(kāi)源模型Qwen-7B和Qwen-7B-Chat,阿里云確認(rèn)其為通義千問(wèn)70億參數(shù)通用模型和對(duì)話模型,兩款模型均開(kāi)源、免費(fèi)、可商用。在多個(gè)權(quán)威測(cè)評(píng)中,通義千問(wèn)7B模型取得了遠(yuǎn)超國(guó)內(nèi)外同等尺寸模型的效果,成為當(dāng)下業(yè)界最強(qiáng)的中英文7B開(kāi)源模型。
今年4月,阿里云推出自研大模型通義千問(wèn),引發(fā)井噴式的市場(chǎng)需求。此次小型化模型版本開(kāi)源,有望抹平模型使用門(mén)檻,讓海量中小企業(yè)和AI開(kāi)發(fā)者更早、更快地用上通義千問(wèn)。這一舉動(dòng)也讓阿里云成為國(guó)內(nèi)首個(gè)加入大模型開(kāi)源行列的大型科技企業(yè)。
Qwen-7B是支持中、英等多種語(yǔ)言的基座模型,在超過(guò)2萬(wàn)億token數(shù)據(jù)集上訓(xùn)練,上下文窗口長(zhǎng)度達(dá)到8k。Qwen-7B-Chat是基于基座模型的中英文對(duì)話模型,已實(shí)現(xiàn)與人類認(rèn)知對(duì)齊。開(kāi)源代碼支持對(duì)Qwen-7B和Qwen-7B-Chat的量化,支持用戶在消費(fèi)級(jí)顯卡上部署和運(yùn)行模型。
用戶既可從魔搭社區(qū)直接下載模型,也可通過(guò)阿里云靈積平臺(tái)訪問(wèn)和調(diào)用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓(xùn)練、推理、部署、精調(diào)等在內(nèi)的全方位服務(wù)。
通義千問(wèn)7B預(yù)訓(xùn)練模型在多個(gè)權(quán)威基準(zhǔn)測(cè)評(píng)中表現(xiàn)出色,中英文能力遠(yuǎn)超國(guó)內(nèi)外同等規(guī)模開(kāi)源模型,部分能力甚至“躍級(jí)”趕超12B、13B尺寸開(kāi)源模型。
在英文能力測(cè)評(píng)基準(zhǔn)MMLU上,通義千問(wèn)7B模型得分超過(guò)一眾7B、12B、13B主流開(kāi)源模型。該基準(zhǔn)包含57個(gè)學(xué)科的英文題目,考驗(yàn)人文、社科、理工等領(lǐng)域的綜合知識(shí)和問(wèn)題解決能力。
在中文常識(shí)能力測(cè)評(píng)基準(zhǔn)C-Eval上,通義千問(wèn)在驗(yàn)證集和測(cè)試集中都是得分最高的7B開(kāi)源模型,展現(xiàn)了扎實(shí)的中文能力。相比英文世界熱鬧的AI開(kāi)源生態(tài),中文社區(qū)缺少優(yōu)秀的基座模型。通義千問(wèn)的加入有望為開(kāi)源社區(qū)提供更多選擇,推動(dòng)中國(guó)AI開(kāi)源生態(tài)建設(shè)。
在數(shù)學(xué)解題能力評(píng)測(cè)GSM8K、代碼能力評(píng)測(cè)HumanEval等基準(zhǔn)上,通義千問(wèn)7B模型也有不俗表現(xiàn),勝過(guò)所有同等尺寸開(kāi)源模型和和部分大尺寸開(kāi)源模型。
阿里云表示,開(kāi)源大模型可以幫助用戶簡(jiǎn)化模型訓(xùn)練和部署的過(guò)程,用戶不必從頭訓(xùn)練模型,只需下載預(yù)訓(xùn)練好的模型并進(jìn)行微調(diào),就可快速構(gòu)建高質(zhì)量的模型。
開(kāi)源生態(tài)對(duì)促進(jìn)中國(guó)大模型的技術(shù)進(jìn)步與應(yīng)用落地至關(guān)重要。今年7月,阿里云宣布將促進(jìn)中國(guó)大模型生態(tài)的繁榮作為首要目標(biāo),向大模型創(chuàng)業(yè)公司提供智能算力、開(kāi)發(fā)工具等全方位服務(wù)。2022年阿里云牽頭發(fā)起AI模型社區(qū)魔搭,以AI模型為核心服務(wù)AI開(kāi)發(fā)者。目前,魔搭聚集了20多家頂尖人工智能機(jī)構(gòu)貢獻(xiàn)的1000多款開(kāi)源模型,已經(jīng)成為中國(guó)大模型開(kāi)源第一門(mén)戶。(梔橙)