在人工智能技術飛速發展的今天,機器處理現實生活中復雜任務的能力也越來越強大。其中,從現實世界網絡中挖掘有效、相關的信息在許多新興應用中起著至關重要的作用。例如,在社交網絡中,根據個人資料和社交關系將用戶進行分類,而后應用于社交推薦、目標廣告、用戶搜索等功能,在這方面清華唐杰教授及其團隊對人工智能領域做出了不小的貢獻。
萬億參數大模型只是一個開始
清華唐杰教授早先從事數據挖掘和知識工程方面的研究,他曾經不愿意也不敢相信機器智能可以超越人,但大規模預訓練模型改變了他的想法;如今,他開始反問為何機器智能不可以超越人。清華唐杰教授表示,萬億參數大模型只是一個開始,作為一種科學上的探索,智源悟道團隊將堅持在「大」這條路上走下去,探索其邊界,因為他們已經在大模型上觀察到了以往小模型上所不曾有過的現象。但清華唐杰教授同時也指出,單靠增加訓練數據量或模型參數規模不足以實現「智能」,悟道團隊目前踐行的「知識+數據雙輪驅動」,正是嘗試將知識這種符號信息與神經網絡相結合,構建所謂的「神經-符號結合模型」,從而賦予機器認知能力。在更遠期的規劃中,清華唐杰教授希望讓悟道模型擁有自學習的能力,以及作為一個主體與現實世界交互的能力,正如人類兒童在成長中所經歷的那樣。
各種任務精度的提升
至于眼下,一個重點將是基于悟道 2.0 構建一個平臺和生態,讓企業、開發者和研究人員真正用起來——用他的話說就是「大規模預訓練模型不是用來作秀的」,并根據用戶的反饋優化和迭代。不過,這方面的工作將由其他團隊牽頭完成。悟道團隊將持續聚焦,這也是清華唐杰教授個人的研究風格——專注、專注再專注,直到拿出嚴謹、可靠和有力的成果。清華唐杰教授說:「更重要的是各種任務精度的提升,算法的優化,運行效率,以及對整個人工智能軟件和硬件應用及架構的再考察。」要讓機器從數據中學出所有的人類知識,現在所謂的「大數據」根本少得可憐深度學習常為人詬病的一點在于其不可解釋性。然而,存儲在人類大腦中的知識亦然,只不過我們能夠借助語言進行表達。但即便如此,還是有很多無法用言語描述進而抽象為知識的東西。
很大程度上,現階段的深度學習也是如此,大規模預訓練模型確實從數據中學到了什么,但其具體過程或數理機制尚不明晰。在擁有 1.75 萬億參數的悟道 2.0 上,清華唐杰教授團隊觀察到模型不需要訓練數據,可以自動從未標記的數據中學出一些人類知識,有的機器學習出的知識圖譜比人工標注的質量還要好。