(ChinaZ.com)7月26日 消息:中文通用大模型綜合性基準(zhǔn)SuperClue發(fā)布了最新中文大語言模型排行榜。榜單結(jié)果顯示,百度文心一言總分超GPT-3.5-Turbo,領(lǐng)跑國內(nèi)大模型。
此次SuperCLUE從基礎(chǔ)能力、專業(yè)能力、中文特性能力三個(gè)維度70余項(xiàng)子能力,選取國內(nèi)外20個(gè)有代表性的可用大模型進(jìn)行測評,兼具綜合能力考量與中文特定任務(wù)理解積累的考察,并通過自動化測評以相對客觀形式進(jìn)行效果測評。
評測基準(zhǔn)中,基礎(chǔ)能力包括了常見的有代表性的模型能力,如語義理解、對話、邏輯推理、角色扮演、代碼、生成與創(chuàng)作等10項(xiàng)能力;專業(yè)能力包括了中學(xué)、大學(xué)與專業(yè)考試,涵蓋了從數(shù)學(xué)、物理、地理到社會科學(xué)等50多項(xiàng)能力;中文特性能力包括了中文成語、詩歌、文學(xué)、字形等10項(xiàng)多種能力。
百度表示,文心一言v2.2.0版背后搭載的是文心大模型3.5,文心大模型自2019年3月發(fā)布1.0版后,現(xiàn)已升級到3.5版。新版本模型效果提升50%,訓(xùn)練速度提升2倍,推理速度提升30倍。