2024年下半年是大模型發(fā)展由虛向?qū)嵉闹匾A段,在大模型賦能實(shí)體經(jīng)濟(jì)的過(guò)程中,對(duì)算力產(chǎn)生了爆發(fā)式需求。中國(guó)科學(xué)院院士陳潤(rùn)生在2024中國(guó)算力專(zhuān)家研討會(huì)上表示:“大模型是新質(zhì)生產(chǎn)力的代表,大模型和超級(jí)計(jì)算的融合發(fā)展十分重要”。日前,國(guó)產(chǎn)大模型正致力于給世界提供“第二選擇”。10月24日,在2024科大訊飛全球1024開(kāi)發(fā)者節(jié)開(kāi)幕式上,科大訊飛、華為、合肥市大數(shù)據(jù)資產(chǎn)運(yùn)營(yíng)有限公司三方聯(lián)合打造的國(guó)產(chǎn)超大規(guī)模智算平臺(tái)“飛星二號(hào)”正式啟動(dòng),標(biāo)志著國(guó)產(chǎn)化大模型智算集群的再次躍遷,更大規(guī)模訓(xùn)練推理同步啟動(dòng)并加速訊飛星火大模型的迭代歷程。
去年10月24日,首個(gè)國(guó)產(chǎn)萬(wàn)卡算力集群“飛星一號(hào)”平臺(tái)上線,星火大模型持續(xù)引領(lǐng)全國(guó)產(chǎn)算力平臺(tái)發(fā)展,劉慶峰表示,最近一年以來(lái)攻克了很多大模型集群訓(xùn)練的“疑難雜癥”,解決了500多次基礎(chǔ)軟硬件問(wèn)題,模型訓(xùn)練適配優(yōu)化平臺(tái)耗時(shí)從90天縮減到15天,新增30多項(xiàng)框架和平臺(tái)特性,優(yōu)化了150多個(gè)基礎(chǔ)、通信和融合算子。
據(jù)了解,“飛星二號(hào)”將帶來(lái)新模型新算法的持續(xù)適配和智算集群規(guī)模的再次躍遷,持續(xù)探索無(wú)人區(qū)、引領(lǐng)國(guó)產(chǎn)大模型底座的發(fā)展、給世界提供第二種選擇。正如科大訊飛董事長(zhǎng)劉慶峰在會(huì)上所言:“只有在真正自主可控的平臺(tái)上,才有真正的中國(guó)人工智能大未來(lái)。”
訊飛星火正在全國(guó)產(chǎn)算力平臺(tái)基礎(chǔ)上持續(xù)引領(lǐng)國(guó)產(chǎn)大模型的迭代。在10月24日科大訊飛全球開(kāi)發(fā)者節(jié)上,訊飛星火4.0 Turbo正式發(fā)布,七大核心能力全面超過(guò)GPT-4 Turbo,數(shù)學(xué)和代碼能力超越GPT-4o,這些結(jié)論均根據(jù)真實(shí)數(shù)據(jù)背靠背的測(cè)試得出。
目前在大模型領(lǐng)域,由艾倫人工智能研究所、OpenAI等國(guó)內(nèi)外權(quán)威單位發(fā)布的涵蓋理解和推理、綜合考試、數(shù)學(xué)和科學(xué)、代碼等不同任務(wù)類(lèi)型的14項(xiàng)主流測(cè)試集,是用來(lái)比對(duì)大模型核心能力水平的重要工具。訊飛星火4.0-Turbo在14項(xiàng)中9項(xiàng)測(cè)試集中實(shí)現(xiàn)超對(duì)美國(guó)三大主流模型(GPT-4o、Claude 3.5 Sonnet、Gemini 1.5pro)的超越,效率相對(duì)提升50%。
值得一提的是,在硬碰硬”的數(shù)學(xué)能力和代碼能力中,根據(jù)實(shí)用數(shù)學(xué)任務(wù)構(gòu)建測(cè)試集CAppliedMath-1.0,訊飛星火4.0 Turbo在計(jì)算、財(cái)務(wù)、金融、度量等多個(gè)維度的任務(wù)中均超過(guò)GPT-4o水平,已完成超長(zhǎng)思維鏈、樹(shù)搜索和自我反思評(píng)價(jià)等算法驗(yàn)證,預(yù)計(jì)今年底可實(shí)現(xiàn)類(lèi)OpenAI o1的高難度數(shù)學(xué)能力顯著提升。根據(jù)代碼生成HumanEval測(cè)試集上的效果對(duì)比,訊飛星火4.0 Turbo在Python、Java、JavaScript等任務(wù)上和GPT-4o差距微弱,在C++能力上超過(guò)GPT-4o。在真實(shí)應(yīng)用場(chǎng)景中,基于認(rèn)知智能全國(guó)重點(diǎn)實(shí)驗(yàn)室構(gòu)建的iFLYCode-Eval-2.0代碼實(shí)用場(chǎng)景測(cè)試集,訊飛星火4.0 Turbo在代碼生成、代碼檢錯(cuò)、單元測(cè)試等任務(wù)上都超過(guò)了GPT-4o。
此次訊飛星火4.0 Turbo的發(fā)布,表明訊飛星火在不斷夯實(shí)七大核心能力優(yōu)勢(shì),更在決定大模型“聰明程度”的數(shù)學(xué)和代碼能力上持續(xù)進(jìn)步,具備了更強(qiáng)的可用性與行業(yè)適配性。
人工智能應(yīng)用日益進(jìn)入到場(chǎng)景化的深水區(qū),面向未來(lái),科大訊飛董事長(zhǎng)劉慶峰還給出了人工智能產(chǎn)業(yè)發(fā)展的關(guān)鍵是五個(gè)關(guān)鍵詞:頂天立地、自主可控、通專(zhuān)結(jié)合、端云聯(lián)動(dòng)、軟硬一體。。相信基于全國(guó)產(chǎn)算力的大模型自主技術(shù)創(chuàng)新,以“飛星二號(hào)”啟動(dòng)為標(biāo)志,科大訊飛將持續(xù)探索“無(wú)人區(qū)”,給予世界第二選擇的同時(shí),將技術(shù)飛躍與算力躍遷落實(shí)到千行百業(yè),共建AI自主可控、共享共建的繁榮生態(tài)。