圖為小朋友在2023中國國際智能產業博覽會會場體驗訊飛星火認知大模型。 新華社記者 王全超 攝
近期,國內多家科技企業或科研機構面向公眾正式開放自研的人工智能大模型,標志著國內大模型從小范圍內測開始走向大規模應用。大模型將如何為個人和產業賦能?這輪開放服務將為行業競爭帶來什么影響?國內大模型未來的發展趨勢又將如何?
人工智能大模型競爭進入新階段
9月初,科大訊飛宣布訊飛星火認知大模型面向全民開放服務,至此,首批包括訊飛星火、百度文心一言、商湯SenseChat等在內共十余款人工智能大模型全部面向公眾開放服務。另外包括騰訊在內的一些公司的大模型也通過備案,將擇機面向公眾開放。
人工智能大模型是指使用大規模數據和強大的計算能力訓練出來的“大參數”模型,這些模型通常具有高度的通用性和泛化能力,可以應用于自然語言處理、圖像識別、語音識別等領域。
此前我國多家企業和機構已經發布了大模型產品并進行了小范圍內測,此次開放服務的大模型也意味著它們通過了相關部門備案。8月15日,我國正式實施《生成式人工智能服務管理暫行辦法》。
百度公司科技與社會研究中心主任余歡介紹,文心一言自今年3月面世至今快速成長,熟練掌握的創作體裁超過200個,內容豐富度是發布初期的1.6倍,思維鏈長度是初期的2.1倍,知識點覆蓋達到初期的8.3倍。效率方面,文心大模型訓練速度達到原來的3倍,推理速度達到原來的30多倍。
科大訊飛董事長劉慶峰介紹,自5月6日首次發布訊飛星火認知大模型以來,已進行兩次重大迭代升級,在文本生成、語言理解、知識問答、邏輯推理、數學能力、代碼能力、多模態能力7大能力上持續進化。最近一次8月15日發布的訊飛星火V2.0升級發布會上,代碼能力和多模態能力升級。
商湯公司相關負責人介紹,公司此次開放服務的大模型“商量SenseChat”的特點與能力包括高效處理大量文本,強大的自然語言對話、邏輯推演能力、廣泛的知識儲備與信息更新,支持簡體中文、繁體中文、英文等和各種常用的編程語言。
隨著備案成功,各個參與方急切地想要展示年初以來的研發進展和成果。同時更快發布相關服務,就能獲取更多的用戶和行業反饋,從而進一步加速各自大模型的迭代和應用,獲得盡可能多的競爭優勢。”聯想控股股份有限公司副總裁兼前瞻技術研究院院長于浩說。
大模型將為個人和產業賦能
已經上線的國內大模型開放了多個工具,有望成為普通人提升效率的“超級助手”。
劉慶峰表示,自上線測試以來,訊飛星火App的用戶已經開發出2萬多個性化的人工智能助手,每個普通人能調用多個已經上架的人工智能助手,也能通過簡單幾步開發自己的專屬助手,滿足職場、營銷、出行、生活、公文、客服等多種場景需求,幫助解決工作生活中的各種問題。根據訊飛星火認知大模型上線測試以來的數據顯示,目前用戶剛需使用場景依次集中在知識問答、內容生成、創意策劃、生活百科和編程輔助等場景。
大模型作為專家能力的自動化,可以在方方面面給普通人帶來巨大的便利,例如可以幫助普通人學習知識、修改文章、生成方案等等。因此,大模型的集中發布可以讓普通人快速接觸、使用和了解大模型,大模型的良好體驗將會提升普通人對大模型的信任。”中國科學院軟件研究所研究員、中國中文信息學會秘書長孫樂說。
艾利艾智庫相關負責人認為,此次集中上線有望加速國內大模型及下游應用商業化變現。目前行業已經具備大規模商業化條件,從供給端看,現有技術成熟度已可大規模輔助用戶進行內容生產,下游應用供給多點開花,涉及繪畫、寫作和視頻等領域;從需求端看,在文娛碎片化、輕量化驅動下,用戶內容消費需求指數級增長,傳統生產方式導致行業成本壓力劇增,急需通過人工智能生產內容來降本增效。
目前,多家公司正探索大模型在各行業的深度應用。9月初,騰訊混元大模型正式對外亮相并宣布通過騰訊云對外開放API接入服務。騰訊公司相關負責人介紹,騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等多個騰訊內部業務和產品,已經接入混元大模型并取得初步效果,更多業務和應用正在逐步接入中。
以大模型生成技術為核心,人工智能正在成為下一輪數字化發展的關鍵動力,為解決產業痛點帶來了全新的思路。”騰訊集團高級執行副總裁、云與智慧產業事業群CEO湯道生說。
深圳云天勵飛技術股份有限公司于今年7月首次公布了其大模型研發情況。公司相關負責人介紹,基于“天書”大模型,云天勵飛與深圳龍崗政數局共同探索了大模型在政務咨詢服務系統的應用,未來計劃逐步拓展到其他政府機構和公共服務領域,如法務、金融、教育、醫療、交通等。
而對大模型研發公司而言,誰能夠最快帶來最佳行業應用,誰就能夠獲得最多的用戶反饋和數據,進一步增加自身大模型的競爭優勢。
當文心一言向數以億計的互聯網用戶大規模開放服務后,能夠獲得真實世界更多的人工反饋,將有助于基礎模型的進一步改進與產品的更快速迭代,創造更優的用戶體驗。”百度創始人、董事長兼首席執行官李彥宏表示。
大模型處“嬰兒期”仍待“反哺”
業內人士認為,當前國內大模型研發雖然進展迅速,但算力、人才等瓶頸仍待進一步突破,商業模式也還需進一步明晰。
在上海人工智能實驗室教授林達華看來,千億參數規模語言大模型的訓練,最大的困難和挑戰還不在于缺數據,而是試錯成本很高。一個千億參數的大模型,在千卡集群上面需要3個月訓練。每一次更新都需要很大的算力支撐,訓練的周期很長。
于浩認為,作為“底座技術”的大模型目前仍然處于“嬰兒期”,其成長需要極其昂貴并耗能巨大的“算力暖房”,身邊要圍著一批專精人工智能算法優化的“專家保姆”,要供給海量的高質量“數據食材”。稍有不慎攝入“污染食材”或者對大模型“調教不嚴”,就極可能培育出“胡說八道”的“熊孩子”,給大模型企業造成難以估量的影響。
考慮未來可持續發展,一方面是建設大模型基礎設施引擎,筑牢底座,另一方面是培植小模型生態系統,進化出適應人工智能多樣化小場景長尾需求的技術堆棧,用小模型解決實際問題,創造價值變現,再反哺大模型。”于浩說。
在談到國內大模型的發展趨勢時,孫樂認為,首先是隨著大量高價值數據和用戶反饋的獲得,國內大模型的水平會迅速提升。其次,在應用方面大模型會大范圍落地,并且在適合的場景會逐漸形成典型的應用范式。最后,大模型仍然會面臨一些長期的科學問題,如可靠、可控和可信問題,同時也會在大范圍的落地過程中發現新的科學問題,這些問題需要政府、企業界和學術界合力解決。
清華大學新聞與傳播學院教授沈陽認為,國內大模型集中上線將催生一系列發展趨勢,包括技術迭代加速、行業應用深化、商業模式多元化、數據和倫理問題凸顯,以及國際化趨勢。這些趨勢不僅將影響模型本身的發展,還將對社會經濟、法律規范和國際競爭格局產生深遠影響。因此,各方需要密切關注,并做好相應的戰略規劃和應對措施。(記者 馬曉澄 畢子甲 張紫赟 周琳)