【ITBEAR】在人工智能的大模型技術領域,階躍星辰公司正逐漸嶄露頭角,其底層基礎模型能力備受業界認可。盡管這種認可主要局限于對該領域有深入了解的專業人士,但階躍星辰近期在LiveBench榜單上的亮眼表現,無疑將其技術實力推向了公眾視野。
LiveBench,被譽為“世界上第一個不可玩弄的LLM基準測試”,其權威性和公正性在業界享有盛譽。最新榜單顯示,階躍星辰自研的萬億參數語言大模型Step-2,在國產基座大模型中獨占鰲頭,成績直逼OpenAI的頂尖模型,超越了包括GPT-4在內的多個國際主流模型。在全球排名中,階躍星辰緊隨OpenAI和Anthropic之后,位列第五,成為中國唯一進入前十的大語言模型。
此次榜單的發布,不僅是對階躍星辰技術實力的有力證明,更是對中國大模型技術發展的一次重要肯定。在LiveBench的多項測評標準中,Step-2在IF Average(指令跟隨)方面的表現尤為突出,以86.57的高分位居榜首,超越了包括OpenAI最新模型在內的所有國內外語言大模型。這一成績,充分展示了Step-2在復雜指令理解和執行方面的卓越能力。
階躍星辰的技術突破,并非一蹴而就。自2024年3月發布國內首個由創業公司研發的萬億參數語言大模型預覽版Step-2以來,階躍星辰一直在全力提升自身底層實力。從在中文大模型基準測評機構SuperCLUE上登頂國內多模態大模型榜首,到本次在LiveBench上獲得中國大模型第一,階躍星辰的技術進步有目共睹。
Step-2的成功,離不開其背后強大的技術支撐。階躍星辰采用了創新的MoE架構,通過部分專家共享參數、異構化專家設計等創新設計,實現了對模型的高效訓練。同時,階躍星辰在系統能力方面也取得了顯著突破,6D并行、極致顯存管理、完全自動化運維等關鍵技術的突破,為Step-2的高效訓練提供了有力保障。
除了Step-2之外,階躍星辰的Step系列還包括Step-1.5V多模態大模型和Step-1X圖像生成大模型。Step-1.5V在視頻理解和感知能力方面表現出色,能夠準確識別視頻中的物體、人物和環境,理解視頻的整體氛圍和人物情緒。而Step-1X則具備更強的深度語義對齊能力和細節生成能力,能夠生成與中國文化深度契合的高質量圖像。
基于Step系列大模型的技術實力,階躍星辰的產品開發也取得了顯著進展。其C端產品躍問,通過引入圖像交互“即拍即問”功能,解決了用戶在文字和語音交互中難以準確描述的痛點,獲得了用戶的一致好評。目前,Step-2已經接入躍問APP和網頁端,開發者可以通過API接入使用Step-2,進一步拓展了階躍星辰的技術應用場景。
階躍星辰的崛起,不僅為中國大模型技術的發展注入了新的活力,也為全球AI領域帶來了新的競爭格局。隨著技術的不斷進步和應用場景的不斷拓展,階躍星辰正以其階躍之力,向著更加廣闊的星辰大海進發。