【ITBEAR科技資訊】5月9日消息,阿里云正式推出了通義千問2.5版本,該版本在模型性能上全面超越了GPT-4 Turbo,被宣稱為地表最強的中文大模型。此次升級不僅展示了阿里云在人工智能領域的持續努力,也再次鞏固了其在中文大模型領域的領先地位。
據了解,通義千問2.5相較于之前的2.1版本,在理解能力、邏輯推理、指令遵循以及代碼能力等方面均有了顯著提升,分別提升了9%、16%、19%和10%。特別是在中文能力方面,通義千問2.5繼續保持了業界的領先地位。在權威基準OpenCompass上,通義千問2.5的得分與GPT-4 Turbo相媲美,這也是國產大模型在該基準上首次取得如此優異的成績。
同時,通義還發布了最新款的開源模型Qwen1.5-110B,該模型擁有1100億參數。在MMLU、TheoremQA、GPQA等多個基準測評中,Qwen1.5-110B均超越了meta的Llama-3-70B模型,展現出強大的實力。在HuggingFace推出的開源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B更是榮登榜首,證明了通義開源系列在業界的競爭力。
除了通義千問2.5和Qwen1.5-110B外,通義的多模態模型和專有能力模型也備受關注。其中,通義千問視覺理解模型Qwen-VL-Max在多模態標準測試中超越了Gemini Ultra和GPT-4V,已經在多家企業得到實際應用。而通義千問代碼大模型CodeQwen1.5-7B則是HuggingFace代碼模型榜單Big Code的領先者,并作為國內用戶規模第一的智能編碼助手通義靈碼的基石。
通義大模型自問世一年多以來,已經發展出了業界領先的文生圖、智能編碼、文檔解析、音視頻理解等能力。企業客戶和開發者可以通過API調用、模型下載等方式接入通義,而個人用戶則可以通過通義APP、官網和小程序免費使用通義家族的全棧服務。