7月27日,由中國互聯網協會指導、微博和新浪新聞主辦、主題為“融合生態 價值共創”的2022新智者大會召開。作為人工智能領域的行業峰會,本次大會匯聚20余位人工智能及元宇宙相關領域的頂級科學家、企業家及學者。復旦大學計算機科學技術學院教授、CCF/CAAI Fellow王曉陽應邀出席大會,以《新一代人工智能的加速效應》為題發表了主題演講,向觀眾們介紹了新一代人工智能的特性以及人工智能的加速效應。
復旦大學計算機科學技術學院教授,CCF/CAAI Fellow王曉陽做主題演講
以下為王曉陽先生演講實錄,內容經編輯略有刪減:
大家好,很高興今天能夠來到新浪的新智者大會。今天很有幸跟大家講講我的一些看法,今天我講的題目叫《新一代人工智能的加速效應》,我希望從這幾個方面跟大家分享一下我最近的一些想法。
首先,我想從新一代人工智能的特性,從我的理解來稍微地講一下,之后講它的加速的效應,人工智能的加速效應到底體現在哪里。
之后我想專注一下,因為我是做計算機的,信息系統的構建或者信息系統本身是我們研究的一個對象。我們在咱們的新媒體、咱們的所有的目前很多媒體的傳播當中,其實用到了非常多的信息系統。在這兒,我希望提一下信息系統在咱們人工智能的加速效應下,它的一種新的構建的方法論。
首先是這樣,咱們也都知道,老生常談,知識就是力量,我們知識是人類進步的一大源泉。知識目前的狀況是知識不僅以書本的形式出現。在計算機出現之前,我們的知識都是從口口相傳到書本的記錄,這個是很重要的一個方式。
現在的知識不僅是以書本的形式出現了,知識是以數字化,數字的模型化、編碼化、執行的自動化、規模化來展現在我們社會當中。咱們傳統上的體現就在于計算機的軟硬件上,這個是非常明顯的一個進步。也就是說我們知識有了一種新的形態,這是一個很大的轉變。
在咱們新的一代人工智能的情況下面,知識的模型、知識的傳播,以及知識的使用等等,這個已經在一個非常新的狀態下面進行。
我們有新的知識模型的出現,我們的知識模型不再是之前的那種計算機代碼的形式,而以比方說神經網絡這樣的一種編碼。
它的另外一個很大的改變,就是所謂的新知識的來源這樣一個不同。之前咱們新的知識大部分基本上所有都是人類去總結、去編寫,不管是以前書本上面也好,我們把它——知識總結出來寫在書里,傳給下一代,這是一種做法。還有就是咱們計算機的過程當中,咱們人類把知識寫成代碼,讓計算機去執行。在我們新的一代人工智能知識的來源就改變了。
從人類的設計轉變成了一個自動學習的過程,這個使得我們新一代的人工智能它的特點就非常明顯。
原來最早的時候人類是知識的積累者、知識的傳播者,以及知識的執行者。后來有了計算機的發展,使人類在這個過程當中可以把知識交給機器,交給計算機,由計算機去執行。
而目前一種發展的方式,是說知識的積累也不需要人了,人從整個知識的這樣一個閉環里面,可以撤出,從機器當中自己去總結知識,形成編碼,然后自動地執行,這是咱們目前人工智能一個新階段的重要體現。
這個跟之前幾次人工智能的風波、幾次的浪潮不太一樣,很有特色。目前重點的手段,咱們是向數據要知識,知識哪兒來?機器可以像科幻一樣,這個機器人到處走走,它就把知識給積累起來了,但是目前可能還沒有做到這一點。目前重要的手段是向數據要知識,就是人把這個數據交給機器,機器在數據里面去總結出知識來,把這個知識變成編碼等等。
知識數據的重要性,以及存儲介質的價格持續的下降。
以及我們各種各樣新的通信的形態,互聯網、物聯網等等,使得我們數據的積累達到了很大的程度,使得我們目前這一階段的人工智能能夠做到向數據要知識這樣一個過程。
成功案例也很多,我們其實也是老生常談了,大家也知道AlphaGo是一個典型的向數據要知識的做法。我們還有很成功的,像自然語言理解、機器翻譯、圖像識別等等,都是因為我們有了大量的數據的積累,使得我們整個的人工智能能夠形成這樣一個閉環。
現在我們其實人類可能也搞不清楚圖像是怎么識別的,就是這個人過來能認得出這是誰。
但是機器能夠從大量的數據里面總結出來這樣的一些知識,然后把它編成一種代碼。這個代碼可能是一個像我剛才說的,用神經網絡的方式來編碼,編了之后還能去做所謂的推理,能夠推出來眼前這個人是不是某某某,這樣的一個做法。所以整個的環路,都由人工智能來做。
自動駕駛目前是一個好像進展比較慢,但是我相信在不斷收集數據之后,向數據進行學習,我們的人工智能完全能夠做到我們所謂的自動駕駛這樣一種方式。所以成功的案例非常地多,整個使得人工智能給了我們一個美好的向往。
那么它的加速效應也就是我剛才講的這些,咱們傳統的信息系統里面,以代碼的形式來進行知識的編碼。我們計算機其實弄到最后不復雜,都是一些If and else,就是如果這樣就做這個,如果那樣就做那個,這種一連串很復雜的縱橫交錯的組合,形成了我們知識的一種編碼,這就是我們寫的代碼,我們寫的計算機的Code雖然非常多,但是最終的形態還是非常簡單的。但是這種簡單的代碼,就能夠執行很復雜的一些計算、各種各樣的輸入輸出。
我們傳統的計算機代碼是由人類的程序員做的,我們的工具是我們的編程語言。
我們最早是簡單的很低層的代碼,之后我們的編程語言越來越高級,能夠講幾句話計算機可以執行很復雜的指令。但是無論如何,它還是一種人類來編碼的這樣一個過程。
這樣的話這個代碼能不能交給人工智能去構建呢?能不能學習呢?這個肯定是可能的。這個加速其實我們已經看到了,我剛才給的例子里面,我們已經看出來人工智能應該是可以替代整個知識的獲取,以及編碼等等這些功能。雖然可能它的編碼目前不是以我們人類編碼的這種形式,但是它以它獨特的形態,比方說神經網絡這樣的形態來進行工作。
所以新一代人工智能它的加速其實就是在這兒,就是把很慢的這樣一個人,把它從知識的積累到知識的編碼、知識的執行等等,都把人給去除了。這樣的話,可以大大地加快速度,能力也大大地提升。
也就是說新一代的人工智能給咱們知識領域帶來這樣一個重大改變,就是知識得以自動地獲取。我們需要的所謂知識原來是比較慢,人類還是一個慢動作,從計算機的角度來看它是一個慢動作的東西。世界上事物在不斷地變化,知識其實應該隨著事態的變化來更新。
在新一代的人工智能的情況下,我們可以做到更深層的、更及時的來調整我們的知識認識,把這個編碼經常變。不像我們編好一個程序之后,要改變的話是非常難的一件事,如果說把整個的環路能夠由計算機來完成,這個就是非常快速,能夠使得我們知識隨事態來實時的做調整。
最重要的,當然我們之前也都有,這個編碼了之后,我們的知識可以直接加以自動的應用,這是計算機開始以來就有這樣的一個能力。加速使得我們這三個階段、三個層面上都能夠自動地來做。
使得我們新的一代知識方面的應用、知識的工作,能夠大大地加快,它的能力大大地加強。所以咱們今天的主題,也就是要加快對我們人工智能形態的改變。
新媒體其實是最早的人工智能的一個成功的案例,搜索系統,為什么Google能夠很成功?其實就是在于它自己自動的搜集、學習、匹配、排序等等。不需要人了,Google一出來就把Yahoo給打敗,為什么呢?Yahoo還是靠著人來收集的,那就是典型的之前的用人工來編碼的一種計算機系統。
Google的代替,就是把人工編碼給替代掉了。
這樣的話整個的發展速度就非常地快。這是一個非常成功的案例,這也是咱們最早的一個在數據量巨大的情況下面,能夠發展出一種新型的人工智能的東西。
我們后面發展出來的很多,像各種各樣的推薦系統,咱們微博也有自己的推薦系統,熱搜,像頭條的抖音等等,他們都是使用了人工智能的手段,把整個的閉環都由人工智能來推進,使得我們整個的發展非常地快。
這種我把它叫做自動的知識系統,它不斷地收集數據,抽取組織知識,形成一個反饋。
這個是我們目前的一個新的狀態,它所需要的技術當然就是大數據、深度學習、云計算等等,這些技術手段來推進我們人工智能這樣一個快速的發展。
另外一個案例是在風電預測方面,不光是新媒體也受益咱們事態的推進,像實業上面,這里有一個比較簡單的例子風電預測。風電需要預測它,最好是每時每刻都知道,下一階段每時每刻它能發多少電,這個對整個電網的調度非常地有用、非常關鍵。你這個風電能不能被用到,其實是一個很關鍵的事。
這個風電的預測設計了非常多,以前如果要做編碼的話,還是相對比較難和比較復雜的系統,而且它應該是要隨著機器不斷地老化,機器的效率模型也應該是不斷地改變。天氣,Local的天氣,就是比較局部風力的預測,其實也是瞬息萬變,這個也是一直在不斷地改進它自己的一些預測的方式。
所以這里其實是一個很好的人工智能應用的場景,它的風電的效率的模型建模可以不斷地進行對局部天氣的預報,尤其是風力的預報,能夠不斷地更新,使得我們整個現場的風電的預測能夠順利地進行。
這就是要比我們之前的那種進步快很多,因為這個模型由于大量數據的反饋,使得我們這個模型能夠不斷地更新、學習,跟著事態來變化。這樣使得我們整個風電的預測能夠更準確,能夠在整個的場景里面有效地進行。
所以不僅是新媒體,在各種各樣的系統里面,人工智能的應用其實都可以見到這樣一個足跡。
回到信息系統,信息系統就是我們新媒體,我們各種各樣的現代社會基本上都是建立在一個信息系統上面。信息系統有很多,我這里舉幾個例子。
比方說機器學習本身,人工智能一個最基本的能力就是機器學習。
機器學習需要一個系統。機器學習系統本身也是一個我們編碼的過程,它本身就是一個知識的采集,就是怎么進行學習,它是比機器學習本身再高一層的,怎么進行學習這樣一件事其實也是可以由人工智能來幫助我們進行。數據庫系統就是存儲數據的,軟件工程本身怎么編碼這個事也可以由人工智能來幫助。那計算機網絡就更不談,計算機網絡是一個很復雜的系統,在人工智能這樣的手段下面能夠做的更好,網絡空間安全也是。
人工智能在逐漸地侵入到各個領域當中,這一點和前面的我們說人工智能已經發展了有60年了。
這前面的60年只有在最近的5年、10年當中,我們才看到大規模的人工智能的手段進入到我們很多的計算機本身、信息系統本身的領域當中,這是一個很大的改變,這也是使得我們整個技術的更新迭代、技術的發展能夠非常快,可以加速的發展。這也是一個很有意思的現象,我們把人工智能用到我們做人工智能的那些系統里邊去了,這也是一個新的現象。
我們以計算機網絡為例,來看看它到底是怎么弄的。因為計算機網絡其實是一個數據的高速公路系統,可以這樣說。那么所謂的SDN,現在比較流行的SDN,就是所謂的軟件定義的網絡,它形成了一個很靈活的網絡的底座。
你可以把它看成是一個活的復雜系統,你可以隨便地搭建,去重構它的網絡的這種連接。
這個時候人工智能在這里就可以發揮巨大的作用,網絡要適應Traffic,就是你這個數據怎么傳的,怎么去適應它。反過頭來,這個Traffic要去適應網絡,數據怎么傳、從哪里走。另外就是網絡的設計、網絡的維護、網絡的監控等等,以前我們如果完全用人工去做編碼的話,有很多的情況我們是沒法預測、沒法很快地去適應(adapt),這樣的話使得我們這個網絡的效率不會達到最高。
現在的這個手段當然也是傳統手段和現代手段結合的一種方法,但是現代的人工智能所帶來很多的遐想。可以說我們在計算機網絡的設計當中,在這個系統當中,融入我們的AI,就可能帶來非常多的好處,我這里就不再贅述,這是計算機網絡,只是一個例子。
可以看的出來,在我們的計算機系統里面,在復雜的系統當中,由于我們AI的出現,我們AI技術的體現,可以使得我們整個的技術發展的非常快。
如果這樣看來,我們現在的信息系統,包括我們新媒體用到的很多信息系統當中。我們在構建這個信息系統的時候,在新一代AI的條件下面,我們怎么來做?有沒有所謂新的方法論?這個是我想跟各位探討的。
目前的人工智能,至少是目前吧,它是在復雜環境中自動獲取知識的能力非常地強。但是它的準確性,只能是一個所謂的統計概念。我們理想的信息系統不太一樣,我們理想的信息系統是可解釋性要很高,我們是嚴格按照某種邏輯性來做我們的工作的。
但是我們還需要在不確定的環境下面要適應環境,這里尤其是可解釋性和嚴格邏輯性方面,與我們現代的人工智能有點統計意義的做法,有一定的矛盾。
我們怎么樣在這樣的情況下面,又能保證我們理想的信息系統的構建,又能夠利用到大量的人工智能的這種技術呢?
這兒是不是可以提出一種新的所謂的方法論,能不能利用AI,利用人工智能提供的統計意義上的準確知識,為嚴格可解釋的邏輯執行所謂的保駕護航。也就是說它作為一個支撐的,或者是作為某種輔助。就是作為兩條腿走路,一方面是有人工智能的支撐,一方面是嚴格邏輯的支撐,這樣子的話使得我們在整個的信息系統里邊能夠達到更優。
這個其實我們在信息系統的人工智能應用當中看到很多這樣的例子,它就是提供這種所謂的保駕護航,可以看作是我們提供這樣環境的知識,這是一種看法,不一定完全,但是至少它是可以提供某種環境的知識,為嚴格的邏輯在所謂限定的范圍內,以可解釋的形式呈現。
就是說因為我們知道如果用嚴格的邏輯來推導所有的情況,我們的計算量就會承受不了,不管你有多大的計算機,都是不太可能執行。但是如果我們由人工智能學習的這種統計意義上的這些知識,能夠提供一個所謂的環境,一個環境知識,這樣就可以做到我們更有效的工作。
比方說推薦的文章、產品等等,其實我們可以兩個加在一起,也就是說我們推薦不光是一個統計意義上的推薦,而且還可以做一些嚴格邏輯上面的推理。這樣的話,使得我們整個推薦的工作能夠更智能、更貼切,而且它的可解釋性可能會更強一些。
比方說Network里面的Routing,你如果說把所有的可能性都試一遍再去推薦的話,那是不可能的,太多。但是我們如果能夠有一種人工智能的方法去做一些學習,能夠做一些所謂的統計意義上的一個總結的話,可能會有很大的幫助,這也是我們正在做的一些工作。
這樣的話我們可以想像出來,我剛才說是兩條腿,一個新的方法論。這里使得我聯想起來我們談的比較多的所謂的人腦,這本書比較有名,講到了人腦的系統一和系統二的問題。粗略地講,系統一講的是反應,是一個非常快速的條件反射的系統,系統二指的是經過了嚴密邏輯推理的系統。
據丹尼爾·卡尼曼(Daniel Kahneman)來說,我們人腦是這兩個系統協作的一個模式。
這樣的話,使得我們既能夠在很多的情況下面快速的反應,也能夠在其他的情況下面做到嚴格邏輯的推斷這樣的一些工作。
這個其實就跟剛才我講的所謂的人工智能引入到我們的系統當中,它的作用我認為可以這樣考慮,也就是說把人工智能考慮成系統一,我們嚴格的邏輯在后面是叫系統二,這樣合作起來能夠達到一個更優的系統。
這里有很多的挑戰,現在其實還不是太清楚到底是怎么來進行。比方說力度的挑戰,我們系統哪個力度引入系統一,這個確實不太容易。人腦是已經形成的一個系統,我們在做一個系統的時候,我們怎么樣引入?
我們原來的系統基本上都是要么是系統一,就是人工智能的就結束了,要么就是系統二的,那么系統一和系統二怎么結合在一起,這是一個非常有意思的挑戰。力度的挑戰、數據的挑戰、模型的挑戰,系統到底應該長啥樣,就是我們現在的神經網絡還是什么?效率的挑戰、整合的挑戰等等,很多的挑戰使得這兩個系統能夠合到一起。使得我們這種目前所用的系統,包括新媒體所用的各類的系統,能夠在這樣的一個環境下面更快地推進我們的進步。
這個就是我想跟大家探索這種新的人工智能的特性下面,因為這個知識的自動獲取,這是一個非常大的飛躍。
使得我們整個的信息系統能夠自己形成一個閉環,使它的發展速度會非常快,自動地采集、自動地執行、自行地迭代,這樣加速效應非常高。
在這種情況下面,我們的信息系統的構建,是不是要有一種新的方法?我們也看到這種新的方法在不斷地呈現,這個新的方法我們有沒有一個新的方法論?這個新的方法論是不是就是系統一、系統二結合這樣一個新的方法論,來進行我們人工智能的系統,或者我們下一代的新媒體系統也好,通信系統也好,計算系統也好等等,能不能用這樣的方法。
總之,人工智能還有很大的進步空間,另外一個口號就是系統二在整個的進步當中,好像讓位給了系統一。
但是我覺得系統二的回歸是我們下一代的人工智能總體發展的必要的步驟。
我今天就跟大家分享這些,謝謝大家!
<結束>