去年底,隨著ChatGPT的橫空出世,AI浪潮儼然來襲,國內行業巨頭紛紛入局,大模型領域戰況激烈愈發激烈,想要實現破局,致敬和追趕ChatGPT這一行業標桿,不僅要有“硬實力”,更要通過“巧方法”,在特定方面實現“定點爆破”和彎道超車。
而企業的技術積累、發展稟賦各不相同,這種“破局”妙法也不可一概而論。不過讓人眼前一亮的是,最近,科大訊飛這家始終致力于深耕國內AI技術,在智能語音、自然語言理解、計算機視覺等核心技術上處于前列的行業“領跑者”,率先讓業界看到了新火花。
5 月 6 日,訊飛星火認知大模型成果發布會在合肥召開,“星火”認知大模型正式發布,四大行業應用成果也落地演示。此次發布會可謂業界矚目,無論“星火”,還是率先落地的應用成果,都引發現場掌聲雷鳴不斷。
不過,如若細品大模型的發布的一些“小細節”,更能讓人感受到“意外之喜”。不妨讓我們回顧下發布會上,演示者對“星火”的三次“刁難”。
“孫悟空和奧特曼也偷偷潛入了會場,他們都爭著想做訊飛星火認知大模型的代言人,還為此吵了一架,請根據上述信息創作一個故事。”隨后,“星火”便腦洞大開,為我們娓娓道來一則生動故事。
“花壇里有三種花,一共 88 朵,其中月季花的數量是菊花的 4 倍,牡丹花的數量是菊花的 5 倍少 2 朵,那么請問花壇里一共有多少朵牡丹花?”,面對這一則讓“大模型”頭大的難題,“星火”卻“學霸氣質”盡顯,作答行云流水,步驟分明。
“菠菜和豆腐能不能一起吃”、“量子科技有哪些應用領域?”,面對跨領域的靈活問題,“星火”也從容自如,邏輯清晰。
在這些方面,“星火”的智慧涌現驚艷全場。據悉,在文本生成和數學能力上,星火認知大模型已經國內顯著領先,且相比ChatGPT也具有一定優勢;在語言理解和知識問答方面也達到接近ChatGPT水平,處于國內領先水平。
不同維度的“巧突破”,特定賽道上的率先追趕,彰顯了科大訊飛在這些領域上的“硬實力”,這無疑首先來自訊飛為認知大模型“智能涌現”所做出的核心技術儲備:從 2011 年承建語音及語言信息處理國家工程實驗室,再到多年以來在各個國際AI比賽中的成果井噴,一路走來,訊飛在AI的語音識別、科學知識、閱讀理解、多模態等方面,已經有著雄厚的技術支撐。
其次,完善的算力設施、成建制、無內耗的優秀研究團隊、工程上的長期投入與豐碩成果,以及長期積累下的海量中文語料、行業性的高質量數據,也都為此次亮劍“星火”技術,提供依托。
可另一方面,優秀的技術是“實”,卻不能成為評價成果的標準,也就是“名”,“有名有實”才是“星火”本色。肯定有人要質疑,為什么科大訊飛,你“能說”在某些領域上,訊飛星火有著能夠比肩甚至超越業界老前輩ChatGPT的名義?
這當然不是空口無憑,而是有公正“裁判”來“打分”。科大訊飛董事長劉慶峰在發布會上便表示:“我們要向OpenAI致敬和學習,同時也要快速追趕并努力超越,而這需要一套科學系統的評測體系”。在這一方面,科大訊飛開展廣泛的業界合作,通過認知智能全國重點實驗室牽頭設計了通用認知大模型評測體系,并與中科院人工智能產學研聯盟和長三角人工智能產業鏈聯盟共同探討形成了覆蓋 7 大類 481 個細分任務類型。
在致敬和追趕ChatGPT的道路上,公正、科學的評測體系,無疑為“星火”的燎原之勢提供了嚴格的“坐標參照系”,而這無疑也是“巧實力”的一部分:不蠻干、胡干、硬干,而是追求準確定位,定向突破,實現“巧破局”。
準確定位,謀求“巧破局”,這也是本次發布會的重點內容。在隨后的演示里,劉慶峰坦言,目前純大模型有著許多技術上的缺陷與不足,這也是“星火”乃至業界都難以避免的。由于大模型基于深度學習算法,多采用歷史數據進行訓練,因此對新知識往往更新不足,而且會出現對于時事類問答的“張冠李戴”,以及在史實、傳統典籍上的回答容易“編造情節”,甚至會出現將“白龍馬”編造為“龍族公主”這種讓人哭笑不得的回答。
然而正是因為能夠清晰定位目前存在的不足,才能針對這些難點、痛點,發揮“巧實力”,率先攻堅克難的嘗試。劉慶峰也向大家展示了,“星火”今年發展“振奮人心”的三個里程碑:在 6 月 9 日,突破開放式問答,能夠實時對話。實現多輪對話能力和數學能力再升級;在 8 月 15 日,突破代碼能力,多模態交互再升級;再 10 月 24 日,通用模型,能夠對標ChatGPT,在中文上實現超越,在英文上旗鼓相當,而這“就是用我們剛才講的科學系統的評測方法”。
“燃燒最亮的火把,要么較早燎原,要么較早熄滅”,談起科大訊飛的技術愿景,劉慶峰信心滿滿。相信在未來,憑依系統性創新和技術能力,訊飛“星火”,也將為業界帶來更多新可能。
(推廣)