【ITBEAR科技資訊】9月12日消息,微軟研究院昨日宣布推出了一款全新的預訓練語言模型,名為phi-1.5,該模型包含13億個參數,旨在適用于各種自然語言處理任務,如問答(QA)、聊天和代碼生成等多個場景。
據悉,phi-1.5的訓練數據來源多樣,包括來自StackOverflow平臺的Python相關問答內容、競賽代碼,以及合成的Python教科書等多種數據集。這一多樣性的數據集有望讓模型更好地理解和處理不同領域的文本信息。
微軟表示,在一系列的基準測試中,phi-1.5表現卓越,尤其在常識、語言理解和邏輯推理方面表現突出。與擁有70億參數的meta公司的llama-2模型相比,phi-1.5在AGIeval得分上超越了后者。此外,在帶有LM-eval Harness的GPT4AL測試套件中,phi-1.5也展現出與70億參數的llama-2相媲美的性能。
這一新的預訓練語言模型的發布,有望為自然語言處理領域帶來更強大的工具,為各種應用場景提供更高效的解決方案,進一步推動了自然語言處理技術的發展和應用前景。