近日,OPPO安第斯大模型 (AndesGPT)登上SuperCLUE的9月排行榜,在十大基礎能力排行榜的“知識與百科”能力中僅次于GPT4排名國內大模型第一,“角色扮演能力”中排名前三。
SuperCLUE是針對中文可用的通用大模型的一個測評基準,它著眼于綜合評價大模型的能力,使其能全面的測試大模型的效果,又能考察模型在中文上特有任務的理解和積累。SuperCLUE從三個不同的維度評價模型的能力:基礎能力、專業能力和中文特性能力,其中基礎能力包括了常見的有代表性的模型能力,如語義理解、對話、知識與百科、邏輯推理、角色扮演、代碼、生成與創作等10項能力。
安第斯大模型 (AndesGPT)作為OPPO自主訓練的生成式大語言模型,在8月初就開始隨著OPPO智能助理小布啟動對外邀測,旨在對傳統語音助手進行內核級升級,9月初行業發現OPPO也在申請“AndesGPT”相關的商標。
此次在SuperCLUE十大基礎能力排行榜上,“知識與百科”能力AndesGPT測試得分高達98.33,大幅度領先其他大模型,僅次于GPT4排名國內第一,這與知識與百科問答是智能助手最剛需應用場景息息相關。早在2020年,OPPO就已啟動相關技術的探索與實踐,曾獲得大規模知識圖譜問答KgCLUE行業評測的第一名,此次曝光的AndesGPT也是主打知識與問答能力,通過引入高質量的知識圖譜、QA問答數據,并結合對預訓練和指令精調技術的優化,顯著提升了大語言模型知識與百科能力的覆蓋面和準確性。
依托于近5年的技術積累,OPPO在對話交互技術方面已處于行業第一梯隊,其小布助手是手機上最早月活破億的同類產品,用戶交互產生的真實對話場景海量數據是大模型時代最寶貴的養料。AndesGPT的技術路線正是對話增強大語言模型,與其智能助理核心應用場景高度關聯,側重于對話能力的提升。
據了解,AndesGPT包含了一系列不同參數規模的大語言模型,從十億起步,最高多達千億級,可支撐多元化的應用場景。未來,AndesGPT將持續加持OPPO智能助手小布的AI能力,為用戶帶來更好的使用體驗,并逐步應用于更多OPPO核心產品中。