近日,AI智能助手Kimi宣布支持200萬(wàn)字無(wú)損上下文,在長(zhǎng)上下文窗口技術(shù)上再次取得突破,引燃人工智能領(lǐng)域新一輪投資熱情。
攝影/寧穎OpenAI官方去年11月發(fā)布的GPT-4 Turbo,支持128k上下文,大約相當(dāng)于10萬(wàn)漢字。Kimi智能助手在去年10月首次亮相時(shí),支持20萬(wàn)漢字的無(wú)損上下文長(zhǎng)度;5個(gè)月后,3月18日,Kimi智能助手啟動(dòng)200萬(wàn)字無(wú)損上下文內(nèi)測(cè)。從“20萬(wàn)”提升至“200萬(wàn)”,不到半年。
國(guó)產(chǎn)大模型Kimi火了
Kimi是誰(shuí)?這是來自Kimi的自我介紹:“嗨,我是Kimi,由月之暗面科技有限公司(以下簡(jiǎn)稱“月之暗面”)開發(fā)的人工智能助手。我擅長(zhǎng)中英文對(duì)話,能夠提供安全、有幫助且準(zhǔn)確的信息。我可以閱讀和理解各種文件格式,解析網(wǎng)頁(yè)內(nèi)容,并結(jié)合搜索結(jié)果來回答問題。如果你有任何疑問或需要幫助,隨時(shí)可以問我。”
3月18日,月之暗面宣布,Kimi智能助手已支持200萬(wàn)字超長(zhǎng)無(wú)損上下文,并開啟產(chǎn)品內(nèi)測(cè)。Kimi智能助手的智能搜索功能,可根據(jù)用戶的問題,主動(dòng)去互聯(lián)網(wǎng)上搜索、分析和總結(jié)最相關(guān)的多個(gè)頁(yè)面,生成更直接、更準(zhǔn)確的答案。此前,在2023年10月公司的智能助手可以實(shí)現(xiàn)20萬(wàn)無(wú)損上下文長(zhǎng)度,最新能力提升了一個(gè)數(shù)量級(jí)。
關(guān)于長(zhǎng)度提升后有何變化,21日,月之暗面相關(guān)負(fù)責(zé)人表示,這會(huì)進(jìn)一步幫助打開對(duì)AI應(yīng)用場(chǎng)景的想象力,包括完整代碼庫(kù)分析理解、可自主幫人類完成多步驟復(fù)雜任務(wù)的智能體Agent、不會(huì)遺忘關(guān)鍵信息的終身助理、真正統(tǒng)一架構(gòu)的多模態(tài)模型等。
3月21日,因流量突然劇增,有不少用戶在社交平臺(tái)上表示,kimi智能助手的App和小程序無(wú)法正常使用。當(dāng)天,月之暗面發(fā)布情況說明表示,從3月20日上午九點(diǎn)半開始,官方觀測(cè)到Kimi的系統(tǒng)流量持續(xù)異常增高,流量增加的趨勢(shì)遠(yuǎn)超公司對(duì)資源的預(yù)期規(guī)劃。這導(dǎo)致了從3月20日上午十點(diǎn)開始,有較多SaaS(software as a service,軟件即服務(wù))客戶持續(xù)遇到“429:engine is overloaded”的異常問題,對(duì)此月之暗面表示抱歉。
圖源:網(wǎng)絡(luò)AI應(yīng)用及算力打開增量空間
Kimi作為千億大模型,能夠支持復(fù)雜運(yùn)算,同時(shí)還能接受和處理大文本,解決了很多大模型實(shí)際應(yīng)用中的難題,后續(xù)商業(yè)化潛力凸顯。
有一個(gè)演示鮮明地展現(xiàn)了Kimi高超的“吃瓜”智能。使用者將《甄嬛傳》劇本傳給Kimi,再問它哪些細(xì)節(jié)表明甄嬛的孩子是果郡王的?Kimi能在不同時(shí)間段、各個(gè)場(chǎng)景的故事情節(jié)中,深入挖掘出相關(guān)線索并一一列出,堪比一個(gè)看了幾十遍電視劇的“甄”學(xué)家。
經(jīng)濟(jì)觀察報(bào)記者測(cè)試將一份長(zhǎng)達(dá)187頁(yè)的上市公司年報(bào)全文輸入到Kimi,1分鐘之內(nèi),僅為1頁(yè)的核心內(nèi)容被提取出來,包括上市公司的基本信息、財(cái)務(wù)概覽(營(yíng)業(yè)收入、凈利潤(rùn)等)、利潤(rùn)分配、公司治理等十項(xiàng)核心內(nèi)容。這一功能可以幫助投資者迅速了解上市公司的簡(jiǎn)要財(cái)務(wù)情況。
國(guó)信證券表示,Kimi成為國(guó)產(chǎn)大模型曙光,帶動(dòng)產(chǎn)業(yè)鏈革新。Kimi憑借其在處理長(zhǎng)文本方面的卓越能力,能夠處理高達(dá)200萬(wàn)字的輸入,顯示出其在無(wú)損閱讀方面的巨大潛力。這一突破不僅提升了內(nèi)容創(chuàng)作和整理的效率,還為小說、劇本創(chuàng)作等領(lǐng)域帶來了深化和創(chuàng)新,同時(shí)在游戲互動(dòng)、AI陪伴和專業(yè)領(lǐng)域任務(wù)執(zhí)行等方面開辟了新的應(yīng)用場(chǎng)景。
值得注意的是,業(yè)內(nèi)人士認(rèn)為,文本長(zhǎng)度只是反映大模型能力的一個(gè)側(cè)面,并非評(píng)判模型訓(xùn)練能力的唯一標(biāo)準(zhǔn)。郭濤表示,模型的訓(xùn)練能力還包括對(duì)不同類型數(shù)據(jù)的處理能力、模型的穩(wěn)定性、可擴(kuò)展性等多個(gè)維度。“在多模態(tài)、參數(shù)規(guī)模、通用性等方面,我們與Open AI等海外企業(yè)還有一定距離。”賽智產(chǎn)業(yè)研究院院長(zhǎng)趙剛坦言。
人工智能需要差異化競(jìng)爭(zhēng)
從千億參數(shù)到千萬(wàn)長(zhǎng)文本,大模型又“卷”出了新高度。而一同被“卷”起來的,還有大模型的商業(yè)化進(jìn)程。
360集團(tuán)、阿里、百度等頭部廠商紛紛宣布升級(jí)AI大模型技術(shù)。3月22日,阿里通義千問宣布,向所有人免費(fèi)開放1000萬(wàn)字的長(zhǎng)文檔處理功能。3月23日,360智腦宣布正式內(nèi)測(cè)500萬(wàn)字長(zhǎng)文本處理功能,該功能即將入駐360AI瀏覽器,同時(shí)360AI瀏覽器App也即將上線。另外,百度文心一言4月份將進(jìn)行版本升級(jí),屆時(shí)將開放長(zhǎng)文本處理能力,文字范圍在200萬(wàn)-500萬(wàn)字。
不少AI從業(yè)者認(rèn)為,目前,長(zhǎng)文本能力或可以成為大模型公司吸引市場(chǎng)關(guān)注,贏得競(jìng)爭(zhēng)的路徑之一,不過要做好“長(zhǎng)”“準(zhǔn)”、成本三者之間的平衡,還需要不斷摸索。
從Kimi智能助手宣布升級(jí)后用戶激增導(dǎo)致產(chǎn)品出現(xiàn)無(wú)法正常使用的現(xiàn)象來看,人們確實(shí)有大量的對(duì)大模型處理長(zhǎng)上下文的需求。不過,提升上下文長(zhǎng)度還存在一些難題,比如引起大模型智能水平下降或大幅增加運(yùn)營(yíng)成本等。此次各個(gè)大模型迅速宣布升級(jí),是否都能達(dá)到讓用戶滿意的效果,還需要時(shí)間觀察才能得出結(jié)論。
縱觀海內(nèi)外大模型發(fā)展概況,國(guó)際上,呈現(xiàn)Open AI和微軟領(lǐng)先、谷歌追趕、Meta發(fā)力開源的格局,通用大模型能力相對(duì)成熟,應(yīng)用生態(tài)呈現(xiàn)繁榮發(fā)展態(tài)勢(shì)。國(guó)內(nèi)方面,騰訊、阿里、百度、科大訊飛、商湯科技等巨頭和AI公司都紛紛推出了大模型,同時(shí),各行業(yè)也不斷涌現(xiàn)垂類大模型。目前,國(guó)內(nèi)公布的大模型數(shù)量已超過200個(gè)。
(中國(guó)小康網(wǎng)綜合經(jīng)濟(jì)日?qǐng)?bào)、澎湃新聞、第一財(cái)經(jīng)、中工網(wǎng)、中國(guó)證券報(bào)等)
END