【ITBEAR】近期,大模型行業再度掀起波瀾。先是OpenAI悄然發布了o1模型的預覽版,緊接著,國內智譜公司也推出了其最新的基座大模型GLM-4-Plus,這款模型被認為是智譜當前最強大的產品。
清華大學基礎模型研究中心的最新評測顯示,GLM-4-Plus在綜合能力上排名前三,打破了國外大模型長期壟斷前三的局面,并在多個關鍵能力上保持國際領先水平。
GLM-4-Plus的提升體現在多個方面。首先是語言理解能力,通過大規模語料庫訓練和優化算法,GLM-4-Plus在處理復雜語義上的表現尤為出色。例如,在難度較高的水果熱量計算任務上,GLM-4-Plus成為首個在此題拿到滿分的模型。
GLM-4-Plus還具備出色的長文本處理能力,支持128K上下文,憑借創新的記憶機制和分段處理技術,能夠高效地處理大量文本信息。同時,它在時序問答和多輪對話能力上也有所突破,能夠針對單個視頻進行多輪對話問答。
為了驗證GLM-4-Plus的實際應用能力,我們在智譜的開放平臺上進行了針對性的場景測試。在財務報告的閱讀和信息整理任務中,GLM-4-Plus迅速給出了我們想要的信息,并自動將單位進行了換算,精準“捕捉”了未在圖表中體現的數據。
在圍繞細節信息的對話問答中,GLM-4-Plus也表現出色。例如,在詢問“目前有多少研發人員,30歲以下年輕人占比”的問題時,GLM-4-Plus不僅準確抓住了2024年的數據,還給出了表格中沒有的計算過程。
除了歸納總結和信息檢索,GLM-4-Plus在內容生成方面也有不俗的表現。我們嘗試讓GLM-4-Plus在報告的基礎上提煉核心信息并生成視頻腳本,結果再次超出了我們的預期。GLM-4-Plus不僅給出了高分答卷,還涵蓋了旁白、畫面切換以及對插入圖表、數據動畫等貼心建議。
GLM-4-Plus的出現,不僅提升了工作效率,還在改變人機交互的習慣。它的多輪對話能力,讓我們可以對著目錄針對性提問,對整個工作流程和效率進行了重塑。
GLM-4-Plus的應用場景也十分廣泛。有人將其用于生成針對性的面試題目,甚至有人嘗試將其用于數學問題的解答,充當一對一家教。GLM-4-Plus還為智能硬件開發者提供了軟硬協同的合作空間,讓電影《Her》中的場景從科幻走進現實。
值得注意的是,智譜在推出GLM-4-Plus的同時,還為用戶提供了豐厚的福利:10月份將贈送每位用戶1億tokens額度,并根據消耗梯度提供最高1折的API折扣。這一舉措無疑將進一步推動大模型在各行各業的應用。
GLM-4-Plus的能力進階和落地場景令人興奮。它的出現,不僅為大模型廠商和硬件開發者提供了合作的機會,也為千行萬業帶來了前所未有的變革。