【ITBEAR科技資訊】1月29日消息,近日,由前搜狗公司CEO王小川創立的百川智能宣布推出了一款超千億參數的大語言模型——Baichuan 3。據稱,該模型在多項中文任務評測中表現優異,甚至在某些方面超越了GPT-4。
在邏輯推理能力的測試中,Baichuan 3展現出了強大的實力。無論是在MCMLE、MedExam還是CMExam等醫療領域的評測上,其中文效果均超過了GPT-4,被譽為“中文醫療任務表現最佳的大模型”。這一突破性的進展,無疑為中文醫療信息處理領域注入了新的活力。
據ITBEAR科技資訊了解,為了訓練出如此強大的模型,百川智能團隊在Baichuan 3的訓練過程中采用了多種創新技術手段和方案。其中包括“動態數據選擇”、“重要度保持”以及“異步CheckPoint存儲”等,這些技術的運用不僅保證了訓練的穩定性,還大大縮短了故障恢復時間,據悉,故障恢復可在10分鐘內完成。
除了在技術層面的突破,Baichuan 3還在語義理解和生成能力上進行了進一步的提升。通過“迭代式強化學習”技術,該模型在詩詞創作方面展現出了驚人的實力。無論是五言律詩、七言絕句,還是“沁園春”、“定風波”等高難度的宋詞文體,Baichuan 3都能生成工整對仗、韻腳和諧的作品,讓每個人都能體驗到詩詞創作的樂趣。
百川智能作為一家成立不到一年的公司,能夠在如此短的時間內推出這樣一款領先的大語言模型,實屬不易。目前,Baichuan 3大模型已經正式上線,并在百川智能官網上提供了試用服務。相信在不久的將來,這款模型將會在更多領域發揮出其強大的實力。