人工智能的發(fā)展經(jīng)歷了從表示、計算到感知的階段,下一個階段的核心是認知。如何將深度學習與大規(guī)模常識知識結(jié)合起來,實現(xiàn)認知推理與邏輯表達,還面臨著很大挑戰(zhàn)。本期專題介紹了一部分具有代表性的專家在認知圖譜和知識圖譜方面開展的工作。
人工智能發(fā)展的階段
大規(guī)模常識知識庫與基于認知的邏輯推理是人工智能發(fā)展面臨的瓶頸問題。1968年,ACM圖靈獎獲得者愛德華·費根鮑姆(Edward Feigenbaum)研發(fā)出世界首個專家系統(tǒng)DENDRAL,并隨后在第五屆國際人工智能會議上提出,將知識融入計算機系統(tǒng)才能解決只有特定領(lǐng)域?qū)<也拍芡瓿傻膹碗s問題;1999年,萬維網(wǎng)之父、ACM圖靈獎獲得者蒂姆·伯納斯-李(Tim Berners-Lee)爵士提出了語義網(wǎng)(Semantic Web)的概念,其核心理念是用知識表示互聯(lián)網(wǎng),建立常識知識庫;2019年,ACM圖靈獎獲得者約書亞·本吉奧(Yoshua Bengio)在NeurIPS大會上的主題報告中指出,深度學習應該以感知為主向,向基于認知的邏輯推理和知識表達的方向發(fā)展,這個思想和清華大學張鈸院士近期提出的第三代人工智能思路不謀而合。總的來說,人工智能的發(fā)展經(jīng)歷了從表示、計算到感知兩個階段,下一個階段的核心是認知(見圖1)。近期,另一位ACM圖靈獎獲得者曼紐爾·布盧姆(Manuel Blum)夫婦提出了意識AI(意識智能)的思想,這是一個既經(jīng)典又全新的概念和思路,核心理念就是構(gòu)造一個新型的可用數(shù)學建模、可計算的機器認知/意識模型。
圖1 人工智能發(fā)展的幾個階段
近年來,雖然人工智能已經(jīng)取得了快速發(fā)展,但如何將深度學習與大規(guī)模常識知識結(jié)合起來,實現(xiàn)認知推理與邏輯表達,還面臨著很大挑戰(zhàn)。首先,大數(shù)據(jù)環(huán)境下數(shù)據(jù)的分布、異構(gòu)、動態(tài)、碎片化和低質(zhì)等特征給知識工程和知識服務提出了新挑戰(zhàn)。既需要從感知角度學習數(shù)據(jù)的分布表示,又需要從認知角度解釋數(shù)據(jù)的語義。因此,構(gòu)建新一代開放常識知識圖譜和研發(fā)以認知推理為核心的技術(shù)成為突破下一代人工智能技術(shù)的關(guān)鍵。其次,基于深度學習與邏輯推理相結(jié)合的大規(guī)模多粒度知識推理,基于本體、規(guī)則與深度學習相結(jié)合的大規(guī)模知識推理,以及實現(xiàn)億級三元組和萬級規(guī)則的快速推理是另一方面的挑戰(zhàn)。最后,基于時空特性的知識演化模型和推理規(guī)則的自學習,研制知識、推理、邏輯的演化系統(tǒng),能夠根據(jù)外界反饋對知識進行實時更新,從而實現(xiàn)推理規(guī)則的自學習和邏輯表達的自學習,同樣也是我們面臨的挑戰(zhàn)。
認知圖譜的誕生
我們將這個方向重定義為認知圖譜,核心是以實現(xiàn)知識驅(qū)動和數(shù)據(jù)驅(qū)動相結(jié)合的知識表示和推理的認知引擎為目標,研究支持魯棒可解釋人工智能的大規(guī)模知識的表示、獲取、推理與計算的基礎(chǔ)理論和方法;建設(shè)包含語言知識、常識知識、世界知識、認知知識的大規(guī)模知識圖譜以及典型行業(yè)的知識庫,建成知識計算服務平臺。
認知圖譜的主要內(nèi)容包括以下四個方面:
1. 融合表示學習與符號邏輯的知識表示。傳統(tǒng)知識表示方案面臨著數(shù)據(jù)復雜、結(jié)構(gòu)隱含或語義難以解釋的問題,需要研究融合表示學習與符號邏輯的知識表示理論。因其既具備顯式的語義定義和時空特性,又支持大數(shù)據(jù)環(huán)境下高效的知識計算與推理,從而為實現(xiàn)從大數(shù)據(jù)向大知識的轉(zhuǎn)化提供基礎(chǔ)理論和計算框架。
2. 多源、動態(tài)、異質(zhì)碎片化知識的在線獲取和動態(tài)融合。傳統(tǒng)的基于符號表示的知識表示方法適合在領(lǐng)域定義明確的環(huán)境中進行知識的獲取與融合,而基于表示學習的數(shù)值化知識表示方法則更適合在數(shù)據(jù)源數(shù)量龐大、領(lǐng)域邊界不明確、數(shù)據(jù)類型復雜的環(huán)境中工作。因此,將上述兩種方法結(jié)合,研究多源、動態(tài)、異質(zhì)、高噪聲的數(shù)據(jù)處理方法,研究多源、動態(tài)、異構(gòu)環(huán)境中的碎片化知識獲取方法,以及研究碎片化知識的動態(tài)融合方法,是一種有效的知識獲取和融合途徑。
3. 基于時空特性的知識演化和多粒度知識推理。研究基于深度學習與邏輯推理相互約束的大規(guī)模多粒度知識推理模型與方法,研制基于本體、規(guī)則與深度學習相結(jié)合的大規(guī)模知識推理系統(tǒng),使其能夠?qū)Π畠|級資源描述框架(Resource Description Framework,RDF)三元組的知識庫和萬級規(guī)則進行推理,平均響應時間在秒級,并具有良好的可伸縮性。在此基礎(chǔ)上,研究基于時空特性的知識演化模型與預測方法,研制知識演化系統(tǒng),使其能夠?qū)崟r對知識庫進行更新,平均響應時間在秒級。
4. 富知識的用戶理解和交互式知識適配。研究基于復雜知識和推理的用戶行為分析、需求的感知技術(shù),并在此基礎(chǔ)上實現(xiàn)情景驅(qū)動的多通道知識服務模式。這是用戶和智能系統(tǒng)交互的關(guān)鍵,也是近年人工智能發(fā)展的重要方向。這方面的研究主要有兩類,一類是從心理動力學的角度探索如何構(gòu)建人機交互的表征體系,另一類是如何設(shè)計計算模型以實現(xiàn)高效的智能交互策略。
本期專題
本期專題介紹了一部分具有代表性的專家在認知圖譜和知識圖譜方面開展的工作。清華大學的《從知識圖譜到認知圖譜:歷史、發(fā)展與展望》一文從知識圖譜的發(fā)展到認知圖譜的提出給出了一個全面而簡要的解讀;
清華大學的《基于空間認知的知識表示和推理》一文介紹了融合符號推理與神經(jīng)網(wǎng)絡(luò)的認知推理計算。
阿里巴巴集團的《認知圖譜的研究與電商實踐》一文介紹了阿里巴巴正在打磨和落地的第2代AI系統(tǒng)認知智能計算平臺。
中國科學院計算技術(shù)研究所的《圖神經(jīng)網(wǎng)絡(luò)及其在知識圖譜中的應用》一文介紹了基于卷積定理圖神經(jīng)網(wǎng)絡(luò)及其在知識圖譜中的應用。
北京郵電大學的《基于圖神經(jīng)網(wǎng)絡(luò)的知識圖譜研究進展》一文介紹了基于圖神經(jīng)網(wǎng)絡(luò)的知識圖譜學習與計算,以及基于圖神經(jīng)網(wǎng)絡(luò)融合知識圖譜信息的應用的研究進展。
微軟雷蒙德研究院和中國人民大學的《圖神經(jīng)網(wǎng)絡(luò)的預訓練》一文則更多地介紹了自監(jiān)督學習的圖神經(jīng)網(wǎng)絡(luò)及其在認知推理方面可能的應用。
同濟大學的《“神經(jīng)+符號”:從知識圖譜角度看認知推理的發(fā)展》一文介紹了符號邏輯和神經(jīng)網(wǎng)絡(luò)相結(jié)合的計算思路。
浙江大學的《低資源條件下的知識圖譜推理與構(gòu)建》一文介紹了一種被稱為加權(quán)關(guān)系對抗網(wǎng)絡(luò)(weighted Relation Adversarial Network,wRAN)的方法,來解決低資源條件下知識圖譜的關(guān)系預測和關(guān)系抽取問題。
哈爾濱工業(yè)大學的《基于事理圖譜的文本推理》一文介紹了用事理知識表示、推理和決策(包括人的認知)來解決文本推理任務。
展望
本期專題只是一次拋磚引玉,要真正實現(xiàn)知識表示和推理,還需要萬億級的常識知識庫支持以實現(xiàn)真正的機器常識,包括感知、理解和判斷事物的基本能力。常識的缺失阻礙了人工智能系統(tǒng)對世界的理解,也阻礙了其學習新的經(jīng)驗。這一次興起的人工智能浪潮也許到終點還是無法實現(xiàn)推理能力,沒有可解釋能力。而下一波人工智能浪潮的興起,就是實現(xiàn)具有推理能力、可解釋性、認知能力的人工智能,這是人工智能在下一個10年需要發(fā)展也一定會發(fā)展的一個重要方向。
唐杰
CCF 杰出會員,CCCF 前動態(tài)欄目主編, CCF 學術(shù)工委主任。清華大學計算機系教授。主要研究方向為人工智能、知識圖譜、數(shù)據(jù)挖掘、社交網(wǎng)絡(luò)和機器學習。
jietang@mail.tsinghua.edu.cn