(ChinaZ.com)8月15日 消息:8月12日,天津大學和信創海河實驗室舉辦了一次大模型技術與評測研討會,會上發布了首份大模型評測報告。
該報告對國內外14個大語言模型進行了中文綜合能力評測,結果顯示,GPT-4和百度文心一言相對于其他模型綜合性能領先。
在此次評測中,GPT-4對參評模型的主觀題回答進行了打分,結果顯示,GPT-4認為文心一言生成的中文內容質量更高。相比人工評價,在基于 GPT-4的自動評測中,文心一言的總得分超過了 GPT-4,位居榜首。
天津大學表示,大模型有望重塑人工智能的發展模式,國產大模型正在迎頭趕上國際類似模型,并在某些指標上實現了超越。百度文心一言在評測中展現了強大的實力,具備了在相關行業落地的技術基礎。
百度表示,百度在大模型生態的構建上具備先發優勢,目前已經有15萬家企業申請接入文心一言測試。