【ITBEAR】在近期大模型行業遭遇信任危機的背景下,國內多家大模型創業公司遭遇了不同程度的質疑,其中零一萬物更是被傳言放棄了預訓練。對此,零一萬物創始人兼CEO李開復在微信朋友圈進行辟謠,強調公司一直在進行預訓練,并計劃通過推出新的預訓練模型來證明這一點。
10月16日,零一萬物正式發布了其最新的旗艦模型Yi-Lightning,旨在挑戰大模型的更高性能。在LMSYS盲測競技場總榜上,Yi-Lightning取得了顯著成績,位列第六,僅次于OpenAI的GPT-4o、o1系列以及Google的Gemini 1.5 pro系列,與馬斯克xAI旗下的Grok-2持平,這是中國大模型廠商在該榜單上取得的最好成績。
零一萬物特別強調了Yi-Lightning在推理速度上的提升。據其內部評測數據,在8xH100算力基礎下,Yi-Lightning的首包時間相比Yi-Large減少了一半,最高生成速度提升了近四成。這一提升得益于團隊在AI Infra層的投入以及模型架構從Dense Model改為MoE架構。
為了平衡MoE架構中的激活參數規模與推理速度及成本,零一萬物在Yi-Lightning的架構中引入了混合注意力機制、動態ToP路由以及多階段訓練等三種技術思路。這些技術旨在優化模型在處理長序列數據時的性能和計算資源消耗,靈活調整激活的專家網絡數量,以及有針對性地進行強化訓練。
Yi-Lightning的定價為0.99元/百萬tokens,李開復表示這是一個具有理想利潤空間的定價。同時,零一萬物還發布了針對零售和電商等場景的行業應用產品AI 2.0數字人,并已接入Yi-Lightning。這一數字人產品在沒有大模型專家或系統集成商幫助的情況下,具備一定IT能力的客戶可以相對高效地完成部署。
零一萬物已形成了鮮明的海內外商業布局。其ToC業務選擇在國外市場,因為用戶成本更低、變現能力更高。而ToB業務則以國內市場為主,李開復表示,這類業務在海外對供應商本土化要求高,并不適合現階段的零一萬物。在國內ToB業務產品矩陣上,除了已經發布的AI 2.0數字人、API之外,零一萬物還計劃近期發布AI Infra解決方案、私有化定制模型等其他業務。
對于“大模型行業將逐步放棄預訓練”的業界推測,李開復表示,做預訓練通用大模型是一個系統性技術活,需要眾多懂芯片、模型、推理、架構、算法的人才,且成本非常高。他認為,以后可能會有越來越少的大模型公司做預訓練,但“六小虎”均有足夠的融資額度來支付預訓練模型的投產運行成本。
面對通用大模型的下一技術進程,李開復預計五個月后就會有不少類似OpenAI o1模型的能力出現在各個公司,包括零一萬物。他透露,OpenAI目前仍對一些先進技術有所保留,不急于公布。對于縮短中美大模型差距的技術時間差,李開復認為國內公司憑借數據處理、訓推優化等方法論已經有相對成熟的打法,能保持六個月左右的追趕周期已經是很好的結果。