【ITBEAR科技資訊】5月21日消息,近日,大模型競技場LMSYS Chatboat Arena迎來了一位新晉強者。一款名為“Yi-Large”的千億參數(shù)閉源大模型,由中國大模型公司零一萬物提交,其在最新排名中表現(xiàn)搶眼,實現(xiàn)了飛速上漲。
據(jù)LMSYS Chatboat Arena最新刷新的盲測結(jié)果顯示,Yi-Large在全球44款參賽模型中的總榜排名已躋身至第7位,不僅在中國大模型中名列第一,還成功超越了Llama-3-70B、Claude 3 Sonnet等知名模型。更在中文分榜上,Yi-Large與GPT4o并駕齊驅(qū),共同位列世界第一。
此次評測結(jié)果基于超過1170萬的全球用戶真實投票數(shù),其客觀性和公正性得到了廣泛認可。這也是零一萬物首次在國際頂級大模型競技場上獲得如此顯赫的成績,標志著中國在大模型領(lǐng)域的研究實力已不容忽視。
與排名前6的海外巨頭OpenAI、Google、Anthropic的旗艦?zāi)P拖啾龋琘i-Large以僅僅千億參數(shù)量級“以小搏大”,緊追其后。盡管GPT-4、Gemini 1.5 Pro等模型均為萬億級別超大參數(shù)規(guī)模,但Yi-Large在性能和表現(xiàn)上并不遜色。
零一萬物因此成為了總榜上唯一一個自家模型進入排名前十的中國大模型企業(yè),這無疑是對其技術(shù)實力和創(chuàng)新能力的最好肯定。在機構(gòu)排序中,零一萬物01.AI僅次于OpenAI、Google和Anthropic,以開放金標準正式進擊國際頂級大模型企業(yè)陣營。
LMSYS Chatboat Arena作為一個開放的研究組織發(fā)布的評測平臺,以其新穎的“競技場”形式和測試團隊的嚴謹性贏得了全球業(yè)界的廣泛認可。該平臺通過眾籌真實用戶進行線上實時盲測和匿名投票,力求減少偏見并避免刷榜行為,從而確保最終成績的客觀性。
得益于這一公平、公正的評測機制,Chatbot Arena已成為各大廠商競相角逐的熱門擂臺。而此次零一萬物的Yi-Large模型能夠在眾多強手中脫穎而出,不僅彰顯了中國大模型研究的實力,也為中國在人工智能領(lǐng)域的發(fā)展注入了新的活力。