通義千問開源!8月3日,AI模型社區魔搭ModelScope上架兩款開源模型Qwen-7B和Qwen-7B-Chat,阿里云確認其為通義千問70億參數通用模型和對話模型,兩款模型均開源、免費、可商用。在多個權威測評中,通義千問7B模型取得了遠超國內外同等尺寸模型的效果,成為當下業界最強的中英文7B開源模型。
今年4月,阿里云推出自研大模型通義千問,引發井噴式的市場需求。此次小型化模型版本開源,有望抹平模型使用門檻,讓海量中小企業和AI開發者更早、更快地用上通義千問。這一舉動也讓阿里云成為國內首個加入大模型開源行列的大型科技企業。
Qwen-7B是支持中、英等多種語言的基座模型,在超過2萬億token數據集上訓練,上下文窗口長度達到8k。Qwen-7B-Chat是基于基座模型的中英文對話模型,已實現與人類認知對齊。開源代碼支持對Qwen-7B和Qwen-7B-Chat的量化,支持用戶在消費級顯卡上部署和運行模型。
用戶既可從魔搭社區直接下載模型,也可通過阿里云靈積平臺訪問和調用Qwen-7B和Qwen-7B-Chat,阿里云為用戶提供包括模型訓練、推理、部署、精調等在內的全方位服務。
通義千問7B預訓練模型在多個權威基準測評中表現出色,中英文能力遠超國內外同等規模開源模型,部分能力甚至“躍級”趕超12B、13B尺寸開源模型。
在英文能力測評基準MMLU上,通義千問7B模型得分超過一眾7B、12B、13B主流開源模型。該基準包含57個學科的英文題目,考驗人文、社科、理工等領域的綜合知識和問題解決能力。
在中文常識能力測評基準C-eval上,通義千問在驗證集和測試集中都是得分最高的7B開源模型,展現了扎實的中文能力。相比英文世界熱鬧的AI開源生態,中文社區缺少優秀的基座模型。通義千問的加入有望為開源社區提供更多選擇,推動中國AI開源生態建設。
在數學解題能力評測GSM8K、代碼能力評測Humaneval等基準上,通義千問7B模型也有不俗表現,勝過所有同等尺寸開源模型和和部分大尺寸開源模型。
阿里云表示,開源大模型可以幫助用戶簡化模型訓練和部署的過程,用戶不必從頭訓練模型,只需下載預訓練好的模型并進行微調,就可快速構建高質量的模型。
開源生態對促進中國大模型的技術進步與應用落地至關重要。今年7月,阿里云宣布將促進中國大模型生態的繁榮作為首要目標,向大模型創業公司提供智能算力、開發工具等全方位服務。2022年阿里云牽頭發起AI模型社區魔搭,以AI模型為核心服務AI開發者。目前,魔搭聚集了20多家頂尖人工智能機構貢獻的1000多款開源模型,已經成為中國大模型開源第一門戶。
附:開源地址
魔搭ModelScope:
https://modelscope.cn/models/qwen/Qwen-7B/summary
https://modelscope.cn/models/qwen/Qwen-7B-Chat/summary
Hugging Face:https://huggingface.co/Qwen
GitHub:https://github.com/QwenLM/Qwen-7B