科大訊飛劉聰：由ChatGPT浪潮引發的深入思考與落地展望-魔扣目錄

近期，以“生成式人工智能”（Generative AI）為核心技術的聊天機器人ChatGPT火爆全球。百度、阿里巴巴、科大訊飛、360等國內企業紛紛拋出ChatGPT相關進展，打造中國版的ChatGPT。

科大訊飛此前在投資者互動平臺表示，ChatGPT主要涉及到自然語言處理相關技術，屬于認知智能領域的應用之一，公司在該方向技術和應用具備長期深厚的積累。并稱2022年12月已進一步啟動生成式預訓練大模型任務攻關，類ChatGPT技術將在今年5月率先落地科大訊飛AI學習機產品。

近日，科大訊飛副總裁、研究院執行院長劉聰圍繞什么是ChatGPT，它強在哪里？會對未來世界帶來哪些顛覆性影響？進一步闡述ChatGPT來的的模式創新與產業變革。

ChatGPT將會對未來世界帶來哪些重大影響？

在劉聰看來，ChatGPT本質上是一個由浮點數參數表示的深度神經網絡大模型，屬于深度學習的框架。ChatGPT的推出是深度學習提出后又一個里程碑式的技術革命，將為以自然語言處理為核心的認知智能技術發展提供新的“歷史機遇期”。

這次ChatGPT引發全球學術界和產業界的熱議和關注，關鍵原因是ChatGPT通過至少以下五個維度能力的顯著提升，實現了初步的“智慧涌現”：

1、海量高價值信息的全量在線記憶能力；2、自然語言輸入的任意任務和多輪對話理解能力；3、復雜邏輯的思維鏈推理能力；4、多角色多風格的長文本生成表達能力；5、即時新知識學習應用與進化能力。此外，因為引入了代碼作為訓練語料，ChatGPT還額外產生了自動寫代碼和理解代碼的能力。

綜合來看，ChatGPT的能力之強已不僅是停留在單一場景的人機對話，而是一個同時具備多種能力的通用“對話式AI系統”。與傳統認知智能需要針對各領域任務定制對應的系統不同，它不僅能完成多個場景、多輪的相當自然的人機對話，更為重要的是以自然語言交互式學習的“類人”新范式，能在多輪交互中以“類人”的方式交流、學習和進步，并可以自主、快速、不間斷地學習各領域專業知識并達到人類專家水平。

他進一步談到，ChatGPT的初步突破帶來的當前影響和未來想象空間是巨大的。在技術演化的基礎上，以自然語言處理為代表的人工智能算法有可能重構互聯網和移動互聯網的產品形態，促進教育業、醫療業、汽車業、金融業、消費業、媒體業、服務業和制造業等眾多產業的升級，最終帶來對應商業模式的變革。

劉聰認為，類ChatGPT模型的持續發展未來至少會從以下4個方面的能力提升推動產業變革與模式創新：

一是改變現有人機交互模式。未來人們可能用自然對話的方式與智能產品交互，ChatGPT通過精準理解用戶意圖，調用系統的各種軟件或服務來滿足用戶需求，提高交互效率與任務成功率。這種人機交互模式的改變將可能改變當前的APP等應用的使用方式，例如多個功能的軟件能力被整合，甚至出現“大一統”能力的超級通用APP。

二是改變信息分發獲取模式。基于認知智能技術可實現更高效的信息整合和知識推薦等。以搜索為例，傳統搜索引擎根據關鍵字匹配內容，使用者需要在海量搜索結果中篩選出有用信息，而ChatGPT加持的必應直接給出答案，并提高了問題與答案的匹配精準度，大大提升用戶體驗。信息分發獲取模式的改變將影響流量的分布，并改變流量變現的商業模式。

三是革新內容生產模式，提高生產力。作為AIGC（人工智能生成內容）技術的典型代表，ChatGPT一經上線便被大量應用于公文寫作、郵件編寫、代碼編寫等，ChatGPT的編程能力將極大拓展普通人利用電腦和網絡進行創新和創意的能力。未來ChatGPT被集成到word、excel、ppt等工具軟件后，將提升內容生產效率與豐富度，變革人們的辦公方式，成為新的全行業生產力工具。ChatGPT還將帶動圖像、音頻、視頻等形式的AIGC技術與產業發展，使得AIGC的內容既有“好看的外在”，更有“豐富的內涵”。

四是加速“AI for Science”的發展。對于科研人員，ChatGPT不僅可以輔助生成論文摘要與文獻綜述，隨著其學習的科研數據越來越多，未來有可能提供專業的研究建議甚至主動探索發現新的理論，帶來整個科學研究范式的全新變化，把“AI for Science”推上一個全新臺階。

這次ChatGPT所帶來的革命將會深刻地改變當今世界的生產和生活方式，重構產業格局，是人工智能領域推動工業乃至社會變革的重大戰略機遇，是未來發展兵家必爭之地。

科大訊飛在ChatGPT方面有哪些布局？未來研發計劃如何？

在ChatGPT引發的AI技術新一輪熱潮背景下，科大訊飛基于認知智能全國重點實驗室，已在核心算法、行業數據、算力支撐及團隊組建等方面建立了優勢保障。

核心算法上，在Transformer深度神經網絡算法方面擁有豐富經驗，已廣泛應用于科大訊飛的語音識別、圖文識別、機器翻譯等任務并達到國際領先水平；創新提出了知識與大模型融合統一的理解框架X-Reasoner，有望彌補大模型的模糊記憶技術短板，并在認知智能技術領域，2022年累計獲得了常識閱讀理解挑戰賽OpenBookQA等13項世界冠軍；開源了6個大類、超過40個通用領域的系列中文預訓練語言模型，相關模型庫月均調用量超1000萬，在Github平臺獲得星標數位列同類中文預訓練語言模型第一并遠超第二名。

數據積累上，在嚴格遵守適用法律法規前提下，在多年認知智能系統研發推廣中積累了超過50TB的行業語料和每天超10億人次用戶交互的活躍應用，為訓練實現達到人類專家水平的行業認知大模型提供了海量行業文本語料和用戶反饋數據，也為基于大模型的創新應用研發和試點推廣提供了場景保障。

算力支撐上，訊飛在總部自建有業界一流的數據中心，為大模型訓練平臺建設奠定了很好的硬件基石。此外，在工程技術方面實現了百億參數大模型推理效率的近千倍加速，為未來更大更多認知智能大模型技術經濟實惠規模化應用提供了可能。

劉聰表示：“結合我們多年來在深度學習算法、大模型技術、行業大數據、知識圖譜、多模態感知、系統工程技術方面優勢積累，通過最近兩個多月的系統分析和快速驗證，我們非常有信心實現ChatGPT類似的技術階躍進步，并在中文認知智能領域達到國際領先水平。”

為了進一步提高大模型在細分行業的實用性，劉聰說，訊飛計劃采用“1+N”架構，其中“1”是通用認知智能大模型算法研發及高效訓練底座平臺，“N”是應用于教育、醫療、人機交互、辦公、翻譯、汽車、工業等多個行業領域的專用大模型版本。例如，通過學習海量醫學教材、論文和病例，實現專業的醫療領域對話式AI系統，打造“每個醫生的AI診療助理，每個人的AI健康助手”。

此外，訊飛也非常希望基于認知大模型與各行各業的伙伴們在企業數字化、行業內容生產等方面開展深入合作，基于行業數據與知識，形成智能化定制解決方案。我們的技術底座和行業積累合力共贏，能助力合作伙伴跨越認知智能技術壁壘，提高產品競爭力，實現協同創新，共同加快行業轉型升級，推進數字中國建設。

此外談及資本市場當前的熱潮，劉聰認為，全球資本都在ChatGPT的技術突破后看到了人工智能對社會產生的重大產業機遇，眾多行業都有被深度重構的機會，重構過程中一定會產生巨大的全新商業價值，因此資本市場的興奮是可以理解的。

但是我們要踏踏實實把科研做好，把產品做好，把服務做好，最終還是要回到人工智能紅利能否兌現的三大標準：“有沒有看得見摸得著的真實應用案例，有沒有能夠規模化推廣應用的產品，有沒有統計數據能夠證明的應用成效”，只有這些才能夠經得起時間的考驗，才能夠真正把人工智能做實做透。

WechatIMG450