【ITBEAR科技資訊】6月7日消息,商湯科技與上海AI實驗室近日聯合香港中文大學、復旦大學和上海交通大學發布了一款名為"書生·浦語"的大型語言模型。該模型參數量達到1040億,是當前千億級參數的大語言模型之一。它基于一個包含1.6萬億token的多語種高質量數據集進行訓練。
據報道,"書生·浦語"在全面評測中表現出色,在知識掌握、閱讀理解、數學推理、多語翻譯等多項測試任務上都表現優秀,并展現出強大的綜合能力。尤其在綜合性考試中,該模型在多項中文考試中的成績超過了ChatGPT,甚至包括中國高考各科目的數據集。
據ITBEAR科技資訊了解,早在今年3月,商湯科技就發布了另一款名為"書生(INTERN)2.5"的多模態多任務通用大模型。據官方介紹,"書生2.5"具備通用場景下的高級感知和復雜問題處理能力,可以通過文本定義任務,并根據給定的視覺圖像和任務提示語句提供相應的指令或作答。此外,它還能根據用戶的文本創作需求利用擴散模型生成算法生成寫實圖像。
據悉,"書生2.5"在圖文跨模態領域的性能表現得益于視覺、語言和多任務建模三種能力的有效融合。而這次最新發布的"書生·浦語"大語言模型與"書生2.5"大模型之間可能存在一定聯系。
商湯科技與上海AI實驗室的這一發布顯示了大型模型在各行業中的普遍應用趨勢。這些模型的出色表現為人工智能技術的發展帶來了新的可能性,也為各領域的應用帶來了更多機會和挑戰。隨著大模型的不斷涌現,我們可以期待在語言理解、圖像識別等領域取得更多突破。