在探討全球大模型技術(shù)發(fā)展趨勢(shì)的浪潮中,騰訊云北區(qū)云原生業(yè)務(wù)的領(lǐng)軍人物田豐與MiniMax公司的副總裁劉華,攜手與36氪等媒體進(jìn)行了深入交流。此次對(duì)話不僅涵蓋了技術(shù)的最新進(jìn)展,還觸及了商業(yè)化的多重視角,揭示了兩者合作背后的深遠(yuǎn)意義。
展望未來,MiniMax的研發(fā)藍(lán)圖已清晰可見。劉華透露,公司未來的研發(fā)將著重于降低模型錯(cuò)誤率、實(shí)現(xiàn)無限制輸入輸出、以及多模態(tài)技術(shù)的發(fā)展。他特別指出,GPT系列模型的上一代錯(cuò)誤率約為30%,這在文創(chuàng)領(lǐng)域或許可接受,但若應(yīng)用于生產(chǎn)、研發(fā)等場(chǎng)景,錯(cuò)誤率需降至個(gè)位數(shù),MiniMax的目標(biāo)則是2%-3%。同時(shí),隨著大模型應(yīng)用場(chǎng)景的拓展,處理大規(guī)模輸入輸出的能力成為關(guān)鍵,MiniMax最新研發(fā)的Abab 7系列模型,通過創(chuàng)新架構(gòu),有效降低了長(zhǎng)文本的計(jì)算復(fù)雜度。
在談到全球競(jìng)爭(zhēng)格局時(shí),劉華認(rèn)為,美國(guó)的大模型行業(yè)仍占據(jù)領(lǐng)先地位,如OpenAI、Anthropic、XAI等行業(yè)巨頭,憑借強(qiáng)大的資源和技術(shù)優(yōu)勢(shì),占據(jù)了市場(chǎng)的主導(dǎo)地位。然而,中國(guó)的大模型廠商正迅速追趕,特別是在語(yǔ)音和視頻領(lǐng)域,中國(guó)的語(yǔ)音API服務(wù)已接近GPT-4的水平。他預(yù)測(cè),隨著國(guó)內(nèi)科技巨頭的加入,中國(guó)大模型市場(chǎng)的頭部效應(yīng)也將逐漸顯現(xiàn)。
對(duì)于中國(guó)的AI創(chuàng)業(yè)公司而言,劉華看到了廣闊的發(fā)展空間。他以MiniMax為例,指出公司不僅得到了騰訊云等云廠商的支持,還通過成功的商業(yè)化實(shí)現(xiàn)了資金的正向循環(huán)。他強(qiáng)調(diào),為了更好地服務(wù)國(guó)內(nèi)外用戶,自研是必經(jīng)之路,只有打造真正原生性的解決方案,才能擁有具備獨(dú)立競(jìng)爭(zhēng)力的大模型。
在談到與MiniMax的合作時(shí),田豐詳細(xì)介紹了騰訊云所提供的支持。他表示,騰訊云為MiniMax提供了一系列高性能智能產(chǎn)品,涵蓋計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等多個(gè)方面,使MiniMax能夠?qū)W⒂谀P捅旧淼挠?xùn)練和工程化。其中,對(duì)象存儲(chǔ)產(chǎn)品通過元數(shù)據(jù)加速方案和精細(xì)化管理措施,有效提升了性能并降低了成本。數(shù)據(jù)湖產(chǎn)品則針對(duì)語(yǔ)料數(shù)據(jù)預(yù)處理進(jìn)行了優(yōu)化,幫助MiniMax節(jié)約了30%以上的算力,性能提升了35.5%以上。
騰訊云在技術(shù)支持上的實(shí)力不容小覷。其高性能計(jì)算集群通過高效的運(yùn)維機(jī)制,能夠在極短時(shí)間內(nèi)發(fā)現(xiàn)并解決問題,確保系統(tǒng)的穩(wěn)定運(yùn)行。同時(shí),騰訊云星脈網(wǎng)絡(luò)在支持大模型訓(xùn)練方面表現(xiàn)出色,網(wǎng)絡(luò)通信占比低至6%,整體訓(xùn)練效率提升了20%以上。