【ITBEAR】近日,NVIDIA悄然推出了一款名為Nemotron-70B的AI模型,該模型在多個基準測試中表現出色,超越了包括OpenAI的GPT-4和Anthropic的Claude 3.5 Sonnet在內的140多個開閉源模型,其性能僅次于OpenAI的最新模型o1。
AI社區對此反應熱烈,紛紛驚嘆新的開源王者是否已經到來。業內人士更是高度評價,認為用Llama 3.1訓出的小模型能超越GPT-4o,實屬神來之筆。
Nemotron-70B基于Llama-3.1-70B開發,它能夠在沒有專門提示和額外推理token的情況下,正確回答復雜的推理問題,例如“草莓有幾個r”的經典難題。
業內人士指出,NVIDIA在Llama 3.1基礎上訓練出的這個相對不大的模型,能夠超越GPT-4o和Claude 3.5 Sonnet,這標志著一次技術上的重大飛躍。
目前,Llama-3.1-Nemotron-70B-Instruct已經可以在線體驗,為用戶提供了直接感受這款強大模型的機會。
除了推出Nemotron-70B模型,英偉達還開源了用于訓練該模型的數據集HelpSteer2。該數據集包含21362個提示響應,旨在使模型更符合人類偏好,同時也更有幫助、更符合事實、更連貫。該數據集還包含20324個用于訓練的提示響應和1038個用于驗證的提示響應。