6月28日,由清華大學計算機教授、智能技術與系統實驗室副主任黃民烈發起,聯合了十余家科研機構、二十多位知名學者共同制定的全球首個《AI對話系統分級定義》(以下簡稱《分級定義》)正式發布,《分級定義》將推動AI對話系統在虛擬個人助理、智能家居、智能汽車(車載語音)、情感陪護和心理健康等領域的應用有據可依,并將加速下一代AI對話系統的研發與應用。
《AI對話系統分級定義》
起源于圖靈測試的AI對話系統,是人工智能領域最重要的研究方向之一。如果說自然語言處理是人工智能“皇冠上的明珠”,那么AI對話系統則是自然語言處理中最難、最核心的任務之一,是“明珠中最亮的那顆”。因此,AI對話系統被認為是衡量人工智能發展水平的重要因素,代表了人工智能的發展方向。在工業應用領域,AI對話系統呈現出“爆炸式”增長的態勢,如以“小度”“小愛”為代表的智能助理,廣泛應用于個人助理、智能家居、智能汽車中,還有以谷歌對話機器人Meena、Facebook聊天機器人Blender為代表的開放域閑聊產品中,與大眾日常生活緊密相關。
近年來,隨著深度學習技術的不斷發展,AI對話系統已經從基于規則的第一代和以傳統機器學習為核心的第二代,發展到以大數據和大模型為顯著特征的第三代,對話能力產生了革命性變化,在開放話題上展現了驚人的對話能力,對進一步推動人工智能產業發展、實現智能化具有巨大意義和價值。
AI對話系統發展歷程
然而,作為前沿技術,當前AI對話系統標準缺失,造成其在應用中呈現出水平參差不齊、評價體系不一的現狀,導致了業界因認知不統一而對人工智能交互水平出現誤解,也引起了社會上關于意識、倫理、道德等方面的廣泛討論。因此,為了更好地評估AI對話系統的能力水平,清華大學智能技術與系統實驗室副主任黃民烈聯合學界和業界科研機構制定了全球首個《AI對話系統分級定義》,旨在衡量AI對話系統的能力水平,從而促進AI對話系統的進一步研究,同時為工業界應用提供參考。
參與本次《分級定義》的研究機構和研究者包括(以姓氏拼音排序),科大訊飛AI研究院副院長陳志剛,京東集團副總裁、IEEE Fellow何曉冬,清華大學長聘副教授黃民烈,阿里達摩院總監、資深算法專家李永彬,華為諾亞方舟語音語義首席科學家、ACL Fellow劉群,華為諾亞方舟實驗室高級研究員糜飛,百度主任架構師牛正雨,騰訊AI Lab總監史樹明,中國人民大學副教授宋睿華,阿里達摩院總監孫健,小米技術委員會主席、AI實驗室主任王斌,百度技術委員會主席吳華,美團自然語言處理中心總監武威,中國人民大學副教授嚴睿,中國科學院深圳先進技術研究院副研究員楊敏,OPPO高級技術總監楊振宇,哥倫比亞大學助理教授俞舟,北京師范大學新聞傳播學院院長張洪忠,哈爾濱工業大學副教授張偉男,北京聆心智能總監鄭銀河,三星電子中國研究院語言技術部技術總監朱璇。
黃民烈教授詳細介紹《分級定義》
黃民烈教授詳細介紹了《分級定義》的制定情況。他表示,考慮到AI對話系統任務繁多、評價維度多樣、技術路線豐富,撰寫小組在制定《分級定義》時僅關注完全由機器主導的對話系統,人機混合的對話系統不在考慮范圍內。同時,為了在實際應用中發揮價值,《分級定義》的制定是從用戶可感知,以及可觀察、可測量、可度量的角度出發,不考慮系統的具體技術實現方式,也不區分助理類任務、閑聊、知識對話等,均以“場景”進行表述。
在上述原則之下,《分級定義》從自動對話能力、對話質量高低、單一/多個場景、跨場景的上下文依賴和自然切換能力、擬人化程度、主動和持續學習能力、多模態感知與表達能力等角度出發,將AI對話系統劃分為從L0~L5的六個等級,等級越高,AI對話系統水平越高。
在此《分級定義》的標準之下,當前AI對話系統水平最高已發展至L2~L3之間,常見的如“小愛同學”等AI智能助理。
發布現場,各位參加制定的專家學者,就《分級定義》的發布、AI對話系統的發展等話題與媒體進行了交流。華為諾亞方舟語音語義首席科學家、ACL Fellow劉群表示,本次《分級定義》的制定在行業內是一次大膽的嘗試,能夠引發AI對話系統研究領域的思考和討論,幫助研究人員更好地發現系統的問題并明確研究方向。
小米技術委員會主席、AI實驗室主任王斌表示,在從事AI智能助理的研發過程中,時常感到難以評判所開發AI對話系統的水平,因此《分級定義》的制定非常必要。《分級定義》發布后,AI對話系統能力水平的衡量將有據可依,對于用戶來說,能夠更多地關注、更清晰地理解AI對話系統;對行業來說,有助于企業明確研發方向,也能夠促進行業更規范地發展。
北京師范大學新聞傳播學院院長張洪忠一直非常關注社交機器人所帶來的倫理挑戰,他認為《分級定義》的發布有助于社會對AI對話系統的發展階段形成更清晰地認知,對于思考、討論、制定法律規范形成有力參考,以規避AI對話可能產生的倫理問題。
AI對話系統最高級別的應用為復雜情感任務,該《分級定義》的發布將促進AI對話系統在情感任務中體現更高水平,從而促進人工智能未來在情感陪伴、心理健康、虛擬人、元宇宙等方面的應用,大大釋放人力和物力成本,促進前沿科技走進大眾日常生活。
此次《分級定義》的發布,是AI對話系統走向規范化、系統化發展的第一步。接下來,黃民烈教授將聯合該領域相關研究機構及研究者開展白皮書的編纂,聚焦AI對話系統的發展歷程,詳細闡釋《分級定義》的制定目的和標準。