【ITBEAR科技資訊】7月19日消息,百度集團副總裁兼深度學習技術及應用國家工程研究中心副主任吳甜近日向媒體表示,百度的文心一言大模型在最新的AI大模型技術能力評估報告中取得了顯著突破,超越了ChatGPT 3.5,這標志著國內相關技術工作邁出了重要的一步。
根據IDC發布的《AI大模型技術能力評估報告,2023》,百度文心大模型3.5在評估中獲得了7個滿分,拿下了12項指標中的7個第一,綜合評分、算法模型和行業覆蓋三個方面均排名第一。
據ITBEAR科技資訊了解,這份評估報告從產品技術、服務生態和行業應用三個維度考察了大模型的能力,并邀請了包括百度、阿里、騰訊、華為、科大訊飛、360、商湯等14家國內主流廠商參與評估。報告顯示,百度文心大模型在模型能力、工具平臺、生態布局和行業覆蓋等方面具有明顯優勢,并已經進入商業化落地探索階段。
吳甜介紹說,百度從2019年開始專注于預訓練模型的研發,并相繼發布了知識增強文心系列模型。最近,百度正式發布了文心大模型3.5版本,在基礎模型、知識增強、檢索增強等核心技術上取得了創新,并在各個能力方面都有明顯提升。
百度之所以能在大模型能力評估中取得優勢,得益于百度的四層技術棧(芯片-框架-模型-應用)優勢、知識增強的核心特色以及繁榮的大模型生態。特別是百度擁有自研的深度學習平臺飛槳,有效支撐了大模型的高效訓練和推理。飛槳與文心的協同優化使得文心大模型3.5的模型效果提升了50%,訓練速度提升了2倍,推理速度提升了30倍。
在大模型生態方面,百度文心已經形成了企業、教育和社區三位一體的生態體系。最新數據顯示,百度擁有超過750萬開發者基礎和20萬企業生態基礎,并開展了多層次的大模型人才培訓、企業賦能和開發者運營。此外,百度還設立了10億創投基金,以促進大模型的創新和生態繁榮。
吳甜表示,目前大模型產業化仍面臨著巨大的挑戰,主要體現在大模型的體積龐大、訓練難度和成本高、對算力和數據規模的要求等方面。然而,她認為大模型平臺并不需要存在大量的大模型,而是可以依托幾個少量的大模型,形成廣泛的應用生態。
關于“百模大戰”的終局,吳甜表示,雖然近期出現了大量新的大模型,但這只是階段性現象。未來,各個企業和機構會逐漸找到自己的定位,向著細分領域發展。終局只會集中在少數幾個大模型上,但以這幾個大模型為基礎,將出現廣泛的應用生態。