【ITBEAR】近期,中文大模型領域的競爭格局再度迎來新變動。據最新發布的《中文大模型基準測評2024年10月報告》顯示,智譜科技自主研發的GLM-4-Plus模型在SuperCLUE測評中脫穎而出,成為國內外43個大模型中的佼佼者。
SuperCLUE測評旨在全面評估大模型的綜合性能,通過對國內外具有代表性的模型進行多維度、多層次的測試,實時跟蹤其發展趨勢。在本次測評中,GLM-4-Plus憑借在基礎能力和應用能力上的出色表現,不僅在國內大模型中位列第一,而且與國際頂尖模型ChatGPT-4的差距也縮小至2分以內。這一成績充分展示了智譜科技在大模型領域的深厚積累和持續創新能力。
值得注意的是,GLM-4-Plus的優異表現并非偶然。作為智譜全自研GLM大模型的最新版本,該模型在語言理解、邏輯推理、指令遵循以及長文本輸出等方面均實現了顯著突破。這些能力的提升,使得GLM-4-Plus在代碼計算、數據分析、圖像/視頻特征識別等多個領域都展現出了強大的性能,同時大幅降低了成本。
GLM-4-Plus在司南OpenCompass公布的大語言模型對戰榜單Compass Arena中也表現出色。據榜單顯示,GLM-4-Plus的競技場評級分數位居榜首,超越了包括GPT-4在內的眾多國際知名模型。這一成績進一步證明了GLM-4-Plus在真實用戶場景中的卓越表現,也體現了智譜科技在大模型技術領域的領先地位。
據悉,Compass Arena榜單致力于構建一個公正、開放、透明的競爭環境,通過用戶真實反饋和大模型間的對戰數據,采用Elo評分系統對大模型進行排名。GLM-4-Plus能夠在如此激烈的競爭中脫穎而出,無疑是對其技術實力和用戶體驗的雙重肯定。
目前,GLM-4-Plus已經正式上線智譜開放平臺bigmodel.cn,供廣大開發者和用戶試用。隨著技術的不斷進步和應用的持續拓展,相信GLM-4-Plus將在未來為更多領域帶來創新和變革。