上海巖芯數智人工智能科技有限公司(RockAI)近期宣布,其自主研發的Yan架構大模型已成功通過國家互聯網信息辦公室發布的《生成式人工智能服務管理暫行辦法》備案。這一成就標志著Yan架構大模型成為國內首個通過備案的非Transformer架構、非Attention機制的大模型。
Yan架構大模型采用了創新的MCSD架構和類腦激活機制,這一設計顯著提升了模型的性能與效率。相較于傳統的Transformer架構和Attention機制,Yan架構大模型在算力需求上大幅降低,僅需3B參數量即可達到Llama3 8B模型的水平,并且支持在CPU上運行部署。MCSD架構具備快速訓練和推理能力,能夠更高效地提取特征;類腦激活機制則模擬大腦神經元的工作模式,在計算過程中選擇性激活部分參數,有效減少了算力冗余。
此次備案的成功,對RockAI及整個行業都具有深遠的意義。Yan架構大模型的成功備案,為行業探索新的技術路徑提供了有力支撐。它不僅證明了在算力受限的環境下,非Transformer架構的技術路線具有可行性和巨大潛力,還鼓勵了更多企業勇于嘗試多元化的技術發展方向。
值得注意的是,RockAI在AI技術研發領域的創新能力得到了進一步彰顯。目前,RockAI是唯一一家同時擁有非Attention機制大模型和Attention機制大模型,并均通過備案的廠商。這一成就不僅展示了RockAI在技術創新上的領先地位,也為其在商業落地層面贏得了更多機會。
在商業應用方面,Yan架構大模型憑借其低算力要求、本地部署、無損運行等優勢,已經與機器人、無人機、手機、電腦等多個領域的設備廠商建立了深度合作,并成功落地了多個項目。這些項目的成功實施,不僅驗證了Yan架構大模型的實用性和可靠性,也為RockAI贏得了良好的市場口碑。
RockAI自成立以來,一直致力于以“群體智能”的理念構建通用人工智能技術,并以“讓世界上每一臺設備擁有自己的智能”為使命。Yan架構大模型的成功備案,是RockAI踐行這一使命的重要里程碑。未來,隨著Yan架構大模型在更多設備單元上的部署應用,我們有理由相信,RockAI將攜手合作伙伴,共同開拓更加廣闊的市場空間,推動群體智能向通用人工智能的邁進。