人工智能(Artificial Intelligence),英文縮寫為AI。它是研究、開發(fā)用于模擬、延伸和擴(kuò)展人工智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。
人工智能是計算機(jī)科學(xué)的一個分支,它企圖了解智能的實質(zhì),并生產(chǎn)出一種新的能與人類智能相似的方式做出反應(yīng)的智能機(jī)器,該領(lǐng)域的研究包括機(jī)器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等[1]。
毫無疑問,人工智能,是未來國家資源爭奪的基礎(chǔ)工具,人工智能發(fā)展好的企業(yè),將會處于行業(yè)的頂端,在國際鏈條上也會處于食物鏈的頂端,而人工智能基本沒有發(fā)展的企業(yè),將會被鎖定在資源供應(yīng)國的地位,將會被迫被剝奪,被剝削,在微笑曲線的底端。
我國具有人工智能研究大量的基礎(chǔ)數(shù)據(jù),美國具有人工智能研究的最先進(jìn)的技術(shù)或者說是算法,是算法和基礎(chǔ)數(shù)據(jù)的結(jié)合,將會對人工智能的迭代與升級以及研發(fā)的促進(jìn)帶來革命性的新機(jī)遇,所以在人工智能研究上,中國和美國都非常具有優(yōu)勢。
人工智能能夠影響未來的特點(diǎn)之一就是能夠深度學(xué)習(xí),本文重點(diǎn)探討:什么是深度學(xué)習(xí)?
大多數(shù)人認(rèn)為深度學(xué)習(xí)是人類用特定的規(guī)則去“編碼”AI,利用我們自己的認(rèn)知去“教導(dǎo)”AI,才能讓算法具備相應(yīng)的能力。
但事實上深度學(xué)習(xí)是模擬人腦進(jìn)行學(xué)習(xí)的思維方式,有輸入,也輸出,還有復(fù)雜的中間層結(jié)構(gòu)。
受人類大腦內(nèi)部復(fù)雜的神經(jīng)元網(wǎng)絡(luò)的啟發(fā),深度學(xué)習(xí)模擬生物神經(jīng)網(wǎng)絡(luò),構(gòu)建出包括輸入層和輸出層在內(nèi)的人工神經(jīng)網(wǎng)絡(luò),當(dāng)將數(shù)據(jù)輸入該網(wǎng)絡(luò)的輸入層后,在輸出層就會顯現(xiàn)出相應(yīng)的處理結(jié)果。在輸入層和輸出層之間,可能存在很多中間層(又稱隱藏層),從而能夠更深入地刻畫所處理對象的特征,并具備更強(qiáng)大的函數(shù)模擬能力。幾十年前,計算機(jī)算力有限,只能支撐一兩層中間層。近年來,隨著算力增強(qiáng),可以訓(xùn)練出有成千上萬層中間層的網(wǎng)絡(luò),“深度學(xué)習(xí)”即由此得名[2]。
舉個例子,我們?nèi)绻胍芯亢陀?xùn)練AI利用人工神經(jīng)網(wǎng)絡(luò)去深度學(xué)習(xí),去識別和確認(rèn)圖片上是否有花朵,我們需要向AI“投喂”數(shù)百萬張帶著“有花”或“無花”標(biāo)簽的圖片樣板,就好比現(xiàn)在有些家庭里的智能音箱,你越和它對話,說的話越多,給它的信息越多,那么它就會越來越聰明,也是一個道理,都是需要它先去學(xué)習(xí),然后才能通過學(xué)習(xí)后去判斷,去識別,每一次新的輸入行為都能提高輸出正確結(jié)果的概率,而這里面它們學(xué)習(xí)的原理就是:
人工神經(jīng)網(wǎng)絡(luò)的訓(xùn)練是一個數(shù)學(xué)處理過程——通過不斷調(diào)整網(wǎng)絡(luò)中的數(shù)百萬個參數(shù)(有時甚至是數(shù)十億個參數(shù)),來最大限度地提高“只要輸入有花的圖片,就輸出‘有花的判定”的概率,以及“只要輸入沒有花的圖片,就輸出‘無花’的判定”的概率。
在訓(xùn)練過程中,人工神經(jīng)網(wǎng)絡(luò)和其中的參數(shù)會組成一個巨大的數(shù)學(xué)方程組,用以解決有花無花的問題。一旦完成訓(xùn)練,它就可以對從未見過的圖片進(jìn)行判斷,確定圖片上是否有花[3]。
根據(jù)這個原理,我們在做深度學(xué)習(xí)的時候,就要知道如何去建立輸入和輸出,如何提高輸出的正確概率,訓(xùn)練AI,讓它更聰明。
但目前為止,AI還遠(yuǎn)遠(yuǎn)沒有達(dá)到我們想要的目標(biāo),也就是說到現(xiàn)在為止,AI還沒有那么的智能,未來還需要很長的路要走。
那么為什么深度學(xué)習(xí)讓大家這么興奮?
內(nèi)在原因來看,我們發(fā)現(xiàn)她做得比傳統(tǒng)方法好,而且也比傳統(tǒng)方法成本更低。
從成本來看:以前某個任務(wù)需要 3 個工程師從清洗數(shù)據(jù)、找特征、構(gòu)建模型、訓(xùn)練與應(yīng)用,這些都跑完一個流程,需要3個月。這還不算找特征、構(gòu)建模型這些工作需要很強(qiáng)的行業(yè)領(lǐng)域知識與工程經(jīng)驗。總共消耗了9個人月。
而深度學(xué)習(xí)所做的就是,現(xiàn)在只需要一個工程師,清洗數(shù)據(jù)、構(gòu)建模型、訓(xùn)練與應(yīng)用,可能只需要一個月,總共1個人月。
為什么?首先深度學(xué)習(xí)降低了找特征的成本,甚至可以說在某些時候可以把這個過程忽略,在以前這個過程本身可能就需要3~5個人月的反復(fù)工程實驗。而清洗數(shù)據(jù)也更快了,因為深度學(xué)習(xí)的魯棒性更好(rubust),尤其是針對大數(shù)據(jù)的魯棒性(百萬條數(shù)據(jù))。如果放在2、3年前,深度學(xué)習(xí)的訓(xùn)練與應(yīng)用所需要的時間成本也不低,可是現(xiàn)在無論是各種框架(Torch,Keras,TensorFlow)也好,還是各種工程經(jīng)驗也好,都更加充足了,使得時間成本越來越低。
從外在原因來看,深度學(xué)習(xí)遇到了兩個機(jī)會:
1、GPU(顯卡)速度很快,并且深度學(xué)習(xí)可利用,極大的降低了工程實驗成本;
2、互聯(lián)網(wǎng)數(shù)據(jù)獲取越來越容易,數(shù)據(jù)量越來越大(傳統(tǒng)方法很難處理一些領(lǐng)域的大數(shù)據(jù))。
你需要知道的:
- 深度學(xué)習(xí)不是萬能藥,她可能不會、至少短期不會在所有領(lǐng)域上大放異彩
- 深度學(xué)習(xí)同樣需要領(lǐng)域知識,處理文本和處理圖像的模型可以類似,但是細(xì)微差別就可能導(dǎo)致極大的不同,而找到最合適的模型需要工程師本身就有很強(qiáng)的經(jīng)驗
- 深度學(xué)習(xí)并不昂貴,并且成本越來越低,前提是你知道你想要什么
- 深度學(xué)習(xí)需要其他各種知識與能力的配合,例如處理文本依然需要正則表達(dá)式,處理圖像與視頻,依然需要大量的相關(guān)知識
- 深度學(xué)習(xí)是機(jī)器學(xué)習(xí) + 大量的技巧與經(jīng)驗,深度學(xué)習(xí)實際并沒有超出機(jī)器學(xué)習(xí)范疇,各種傳統(tǒng)的測試、驗證方法必須要有;傳統(tǒng)的聚類、分類、強(qiáng)化、回歸模型經(jīng)驗也要有;除此之外,還需要熟悉深度學(xué)習(xí)的各種訓(xùn)練技巧
你可能想嘗試的:
- 把問題總結(jié)好,尋找可能建模的點(diǎn)
- 假設(shè)你擁有一些數(shù)據(jù),人可以通過這些數(shù)據(jù)得出結(jié)論,深度學(xué)習(xí)可能也可以并且成本更低;假設(shè)你沒有數(shù)據(jù),或者人也無法僅僅從這些數(shù)據(jù)得到結(jié)論,那么深度學(xué)習(xí)很可能也無能為力
- 深度學(xué)習(xí)可能是一種低成本的嘗試點(diǎn),不要太高估她,不過至少你覺得有一點(diǎn)點(diǎn)可能性,最好咨詢相關(guān)專家,成本可能沒有你想象的那么高
未來發(fā)展
隨著科技技術(shù)的進(jìn)步,不管是網(wǎng)絡(luò)安全還是大數(shù)據(jù),這些領(lǐng)域會隨著深度學(xué)習(xí)不斷推動行業(yè)的技術(shù)創(chuàng)新與新興行業(yè)的發(fā)展,AI人工智能在以后將會涉及到每個行業(yè),以及我們?nèi)粘5纳睿覀円欢〞吹礁芋@人的進(jìn)步。