【ITBEAR科技資訊】6月10日消息,根據最新的報道,新華社研究院中國企業發展研究中心近日發布了一份名為《人工智能大模型體驗報告》的評測結果。這份報告對主流大模型產品進行了全面的體驗評估,旨在評估它們在基礎能力、智商、情商和工作提效等方面的表現。
綜合評測結果顯示,在國內大模型產品中,百度文心一言取得了優異的成績,成為綜合指數排名第一的產品。百度文心一言在基礎能力、智商、情商和工作提效等各個維度都獲得了國內第一的位置。在智商測試部分,百度文心一言甚至超過了ChatGPT3.5,位列第二,僅次于GPT4。
據ITBEAR科技資訊了解,本次評測選取了基礎能力、智商測試、情商測試和工作提效能力這四個維度,涵蓋了36個子能力和300個問題,對目前主流大模型產品進行了全面測試。同時,研究院還邀請了相關專家組成評測團隊,對各個產品的語義理解、知識儲備和邏輯能力等進行深入分析,最終得出了各廠商的大模型綜合指數評價。
除了百度文心一言,其他大模型產品在基礎能力方面也表現出色,但在面對較復雜的工作內容或情商環境時仍有一定的進步空間。值得注意的是,ChatGPT系列模型在綜合評測中表現出優異的能力,而最新的ChatGPT4.0版本相較于3.5版本在各個能力上都有一定程度的提升。