劃重點:
?? 谷歌發布全新代碼模型 Code Gemma,參數小、性能強。
?? Code Gemma 共有基礎預訓練、指令微調和快速推理三個版本。
?? Code Gemma 在代碼編程、多語言編程等基準測試中表現優異。
(ChinaZ.com) 4月18日 消息:谷歌最近發布了面向企業、開發人員的全新代碼模型 Code Gemma,該模型參數小、性能強,同時對硬件要求較低。Code Gemma 共有基礎預訓練、指令微調和快速推理三個版本,在基準測試中展現出優異的性能表現。該模型使用超過5000億 tokens 的代碼、數學、文本等數據進行了大規模預訓練,能夠快速生成 Python、JavaScript、Java、C/C++、C# 等主流編程語言代碼。
在模型性能方面,Code Gemma70億參數的性能超過了同類代碼模型如 DeepSeek Coder、StarCoder2等,并且推理效率和準確率更高。Code Gemma 系列模型分別是專門針對代碼填充進行訓練的 Code Gemma2B,基礎預訓練模型 Code Gemma7B 以及指令微調版本 Code Gemma7B Instruct。開發團隊在多個數學數據集上進行了監督式微調,進一步提升了 Code Gemma 的推理能力。
Code Gemma 在多個知名測試平臺中獲得了不錯的成績,包括 HumanEval In?lling 平臺、HumanEval 和 MBPP 測試平臺以及 Babel Code 測試平臺。在代碼編程、Python 編碼和多語言編程等任務上,Code Gemma 展現出了強大的編碼能力和優異的性能表現,特別是在 Java、JavaScript 和 Kotlin 等語言上的效果尤為突出。
以上為谷歌發布的 Code Gemma 模型的相關內容,更多詳細信息可參考開源地址和技術報告。
技術報告地址:https://goo.gle/codegemma
開源地址:https://top.aibase.com/tool/codegemma