【ITBEAR科技資訊】4月30日消息,聯發科 AI 研究小組日前發布了全球首個繁體中文 AI 大型語言模型(LLM)。據該公司介紹,這一多語言模型名為 BLOOM-zh,號稱在大多數繁體中文基準測試中優于其前身,同時保持其英語能力。該模型經過額外的繁體中文和英文74億個token的擴展預訓練,覆蓋了多個領域。
聯發科 AI 研究小組在 ICLR 國際表征學習大會上發表了一篇論文,詳細介紹了其使用 Fisher-Legendre(FishLeg)優化的新算法,可以比以前更快、更可靠地訓練 AI 模型。該研究是與英國劍橋大學的神經動力學和控制組合作進行的。聯發科 AI 研究小組將在 5 月 1 日的 ICLR 會議上展示這項成果。
據ITBEAR科技資訊了解,聯發科的 AI 研究小組表示,BLOOM-zh 起源于 BigScience 于 2022 年推出的開源 BLOOM 模型,團隊對 BLOOM 進行了額外的繁體中文和英文 74 億個 token 的擴展預訓練,涵蓋了新聞、書籍、百科全書、教材、口語等多個領域。為了展示 BLOOM-zh 的特性,現有的和新創建的基準場景都用于評估性能。聯發科 AI 研究小組表示,BLOOM-zh 的發布將進一步推動繁體中文自然語言處理領域的發展,為各種應用場景提供更加精準和高效的語言處理能力。
綜上所述,聯發科 AI 研究小組的發布全球首個繁體中文 AI 大型語言模型 BLOOM-zh,將為繁體中文自然語言處理領域的發展注入新的活力。而其使用 Fisher-Legendre(FishLeg)優化的新算法,也將進一步提升 AI 模型的訓練效率和可靠性。