如今的技術開發(fā)成果已經(jīng)讓人印象深刻,計算機可以辨識圖片和視頻里的東西,可以將語音轉化成為文字,其效率已經(jīng)超過了人力范疇。Google也將GoogleTranslate服務中添加了神經(jīng)網(wǎng)絡,現(xiàn)在的機器學習在翻譯水平上已經(jīng)逐步逼近人工翻譯。現(xiàn)實中的一些應用也讓人大開眼界,比如計算機可以預測農(nóng)田作物產(chǎn)量,其準確性比美國農(nóng)業(yè)部還高;機器能更加精準的診斷癌癥,其準確度也比從醫(yī)多年的老醫(yī)師還要高。
深度學習在當下已經(jīng)成為熱詞,人工智能教育踐行者葉偉志認為雖然深度學習的成果不斷涌現(xiàn),但深度學習目前還存在著很多問題,任重而道遠。
一 、 現(xiàn)在 的 機器學習缺乏交互學習的能力
現(xiàn)在一個深度學習的模型,如果拿到一個新的數(shù)據(jù)集上訓練一遍,它會把原來在老數(shù)據(jù)集上訓練的東西全部忘掉。這里需要一種學習能力是自主學習,我們需要這個機器能夠自己去尋找具有價值的一些數(shù)據(jù)和狀態(tài)。
第二種學習方式叫做交互式學習,人類在學習的時候,除了我們自己去觀察這個世界,總結規(guī)律以外,很多的學習來源于和人的交互中得到。
還有一種重要的學習方式是創(chuàng)造性學習,人的智力的核心是具備自己學習和自我創(chuàng)造的能力,現(xiàn)在的機器學習,在這方面非常缺乏。
二 、現(xiàn)在的機器 缺乏常識
一個典型的例子是自動駕駛,學過開車的都知道,從開始學到能夠熟練的開車,可能有幾百公里的駕駛路程就可以了,谷歌的無人車到目前為止已經(jīng)開了幾百萬公里,還是做不到無人完全自動駕駛。其中最主要的一個原因,它不像人類具備一些常識性的推理能力。
這導致的后果是它需要研究人員或工程師,在每一種可能遇到的路況都要做特定的處理,需要在它這幾百萬公里的數(shù)據(jù)里面,盡量的覆蓋可能多的交通狀況和路況。即便如此,它還是不能夠保證能處理遇到的一些新路況。人類學習開車,主要學的是控制方向盤和踩油門,針對前方路況是要開過去還是減速,人類通過常識就可以做到。
三 、 現(xiàn)在 的 機器學習很難從少量的標注數(shù)據(jù)進行學習
比如ImageNet比賽,每一幅圖,機器平均有上千個樣本來學習。而對于人類,要學習識別一個新的物體,給他看一兩眼大概就能學會了。
怎么樣才能夠有效的利用少量的標注數(shù)據(jù)進行學習呢?其中重要的一點就是我們需要有非常好的特征表示,好的特征表示需要有大量的數(shù)據(jù)才能學到,而大量沒有標注的數(shù)據(jù),則需要通過非監(jiān)督的方式才能有效的把里面的特征表示很好的學習出來。
怎么樣做到非監(jiān)督學習呢?就是通過對未來的預測進行非監(jiān)督學習。能夠對未來做出預測是智力一個非常核心的部分。物理學是對一個簡單系統(tǒng)比較精確的預測,而深度學習或者人的智力是對一個復雜系統(tǒng)近似的預測。如果我們能夠對未來進行一個比較好的預測,那就說明這個模型能夠抓住環(huán)境,以及變化的本質規(guī)律,從而能夠提取出一些比較有用的信息,這樣能夠有效的把它用于少量的標注數(shù)據(jù)的學習。
四 、現(xiàn)在 的很多成功應用是基于標注好的一些標注數(shù)據(jù)來學習
對于人類來說,如果要辨別兩只鳥,我們學習的過程就是,根據(jù)以前人類的知識,總結出兩只鳥尾巴長短會的不同,以前的經(jīng)驗還會總結出這兩種鳥的頭部斑紋的不同。人類在接受了語言的描述,知識和經(jīng)驗的累積,可以非常快的學習。現(xiàn)在機器還沒有辦法把人通過語言來傳遞的這種知識和標注數(shù)據(jù),有機的結合進行學習。
葉偉志,壹企問咨詢總經(jīng)理,廣東天使會合伙人,人工智能企業(yè)應用專家,資深軟件開發(fā)工程師。