【ITBEAR】近日,市場傳言稱“大模型六小龍”中至少有兩家已放棄預訓練。對此,零一萬物CEO李開復于10月16日明確辟謠,表示零一萬物絕不會放棄預訓練模型工作,并宣布推出最新旗艦模型Yi-Lightning。
預訓練,作為大模型訓練的第一步,涉及在大規(guī)模數(shù)據(jù)集上對深度學習模型進行初步訓練,其成本近年來持續(xù)攀升。中國市場是否需要如此多的大模型,一直是業(yè)界爭論的焦點。
在接受媒體采訪時,李開復指出,預訓練模型技術(shù)門檻高,需要跨學科的人才團隊通力合作,且成本高昂,未來從事預訓練的公司可能會減少。但他同時表示,據(jù)其所知,“大模型六小龍”均有足夠的融資額度,足以承擔預訓練模型的高昂成本。
零一萬物自成立以來已取得了多個重要進展,包括發(fā)布首款預訓練大模型Yi-34B,以及Yi-Large等系列大模型正式登陸阿里云百煉平臺。在10月16日的發(fā)布會上,李開復介紹,Yi-Lightning在國際權(quán)威盲測榜單LMSYS上取得了優(yōu)異成績,排名世界第六,中國第一。
除了性能升級,Yi-Lightning的推理速度也有大幅提升,首包時間較上半年發(fā)布的Yi-Large提升一倍,最高生成速度提速近四成。值得注意的是,零一萬物將Yi-Lightning的API價格降至每百萬token僅0.99元。對此,李開復表示,這一定價并未虧本,得益于零一萬物獨特的模基共建、模應一體戰(zhàn)略。
在大模型的商業(yè)落地上,零一萬物在to B和to C領(lǐng)域均有布局。李開復介紹,零一萬物在to B業(yè)務(wù)上已找到一些破局空間,如數(shù)字人在零售、餐飲等領(lǐng)域的應用。在發(fā)布會上,零一萬物首度公布了全新to B戰(zhàn)略下的首發(fā)行業(yè)應用產(chǎn)品AI 2.0數(shù)字人,聚焦零售和電商等場景。
9月13日,OpenAI發(fā)布了新模型o1,其復雜邏輯推理能力和數(shù)理能力驚艷業(yè)界。李開復透露,根據(jù)他與OpenAI人員的交流,OpenAI在技術(shù)上還有所保留。他預計,五個月后就會有不少類似o1模型的能力出現(xiàn)在各個公司,包括零一萬物。
與上一代大模型相比,零一萬物Yi-Lightning追擊GPT-4o性能水平的周期從六個月縮短到了五個月。對于如何進一步縮短這一時間差,李開復表示,雖然存在困難,但中國大模型廠商在研發(fā)上有其特色,保持六個月左右的追趕周期已是一個很好的結(jié)果。