首先,人們需要了解什么是AI算法?簡(jiǎn)單地說(shuō),AI算法是使機(jī)器能夠從數(shù)據(jù)中學(xué)習(xí)的數(shù)學(xué)模型。它們有不同的形式,包括監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。
監(jiān)督學(xué)習(xí)算法從標(biāo)記的例子中學(xué)習(xí),而非監(jiān)督學(xué)習(xí)算法則從未標(biāo)記的數(shù)據(jù)中學(xué)習(xí)。標(biāo)記的數(shù)據(jù)是用預(yù)定義的目標(biāo)值進(jìn)行注釋的數(shù)據(jù),而未標(biāo)記的數(shù)據(jù)是未分配任何目標(biāo)值的數(shù)據(jù)。強(qiáng)化學(xué)習(xí)算法通過(guò)試錯(cuò)來(lái)學(xué)習(xí),因此在游戲(如國(guó)際象棋和圍棋)和機(jī)器人行業(yè)中非常流行。
十種常用的AI算法:
(1)人工神經(jīng)網(wǎng)絡(luò)(ANN)
人工神經(jīng)網(wǎng)絡(luò)的靈感來(lái)自人類的大腦,用于圖像和語(yǔ)音識(shí)別以及自然語(yǔ)言處理。人工神經(jīng)網(wǎng)絡(luò)背后的基本思想是輸入數(shù)據(jù),網(wǎng)絡(luò)通過(guò)人工神經(jīng)元層發(fā)送數(shù)據(jù)。每個(gè)神經(jīng)元從上一層獲取信息并計(jì)算輸出,然后將其傳遞到下一層。深度學(xué)習(xí)使用多層人工神經(jīng)網(wǎng)絡(luò),是當(dāng)今幾乎所有AI應(yīng)用程序的首選架構(gòu)。人工神經(jīng)網(wǎng)絡(luò)首次使用是在20世紀(jì)50年代。
(2)支持向量機(jī)(SVM)
支持向量機(jī)(SVM)用于分類和回歸問(wèn)題,其工作原理是找到分離不同數(shù)據(jù)點(diǎn)組的最佳直線或曲線(稱為“超級(jí)平臺(tái)”)。然后,這個(gè)超級(jí)平臺(tái)可以用來(lái)預(yù)測(cè)新數(shù)據(jù)點(diǎn)屬于哪一組。支持向量機(jī)(SVM)可以告訴人們哪些電子郵件是否是垃圾郵件,并被廣泛用于生物信息學(xué)、金融和計(jì)算機(jī)視覺(jué)等領(lǐng)域。
(3)決策樹(shù)
決策樹(shù)是一種用于進(jìn)行預(yù)測(cè)的監(jiān)督學(xué)習(xí)算法。它的工作原理是根據(jù)所選特征的值將數(shù)據(jù)遞歸地劃分為子集。
(4)隨機(jī)森林
隨機(jī)森林是決策樹(shù)的延伸。它們通過(guò)組合多個(gè)決策樹(shù)的結(jié)果來(lái)提高預(yù)測(cè)的準(zhǔn)確性。
(5)K-means聚類
K-means聚類是一種無(wú)監(jiān)督機(jī)器學(xué)習(xí)算法,它根據(jù)數(shù)據(jù)點(diǎn)的相似性將數(shù)據(jù)點(diǎn)劃分為K個(gè)聚類(不同的子集)。K的值由用戶預(yù)先定義或使用算法確定,它在圖像分割和文檔聚類等領(lǐng)域很有用。
(6)梯度增強(qiáng)
梯度增強(qiáng)是一種機(jī)器學(xué)習(xí)技術(shù),它通過(guò)結(jié)合許多弱模型的結(jié)果來(lái)構(gòu)建預(yù)測(cè)模型。它被用于網(wǎng)絡(luò)搜索排名和在線廣告。
(7)卷積神經(jīng)網(wǎng)絡(luò)(CNN)
卷積神經(jīng)網(wǎng)絡(luò)的靈感來(lái)自于人類大腦的視覺(jué)皮層,可以自動(dòng)從圖像中學(xué)習(xí)邊緣和角落等特征。人工神經(jīng)網(wǎng)絡(luò)是通用的,而卷積神經(jīng)網(wǎng)絡(luò)是專門(mén)用于處理網(wǎng)格數(shù)據(jù)(如像素)的網(wǎng)絡(luò),因此用于圖像和視頻處理。
(8)長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)
長(zhǎng)短期記憶網(wǎng)絡(luò)是一種神經(jīng)網(wǎng)絡(luò),用于處理語(yǔ)音和文本等順序數(shù)據(jù),因此對(duì)語(yǔ)音識(shí)別、機(jī)器翻譯和手寫(xiě)文字識(shí)別非常有用。
(9)主成分分析(PCA)
主成分分析(PCA)是一種通過(guò)將數(shù)據(jù)投影到低維空間來(lái)降低數(shù)據(jù)維數(shù)的技術(shù)。它被用于人臉識(shí)別和圖像壓縮。
(10)Apriori算法
Apriori是一種關(guān)聯(lián)規(guī)則學(xué)習(xí)算法,這是一種通過(guò)識(shí)別變量之間的頻繁模式、關(guān)聯(lián)或相關(guān)性來(lái)發(fā)現(xiàn)大型數(shù)據(jù)集中變量之間關(guān)系的技術(shù)。在市場(chǎng)購(gòu)物分析中,識(shí)別經(jīng)常一起購(gòu)買(mǎi)的商品是很受歡迎的。
當(dāng)人們與AI互動(dòng)時(shí),就是在與這些算法進(jìn)行互動(dòng)。人們傾向于將AI系統(tǒng)擬人化,但這對(duì)理解AI來(lái)說(shuō)是沒(méi)有必要的。因?yàn)檫@只是數(shù)學(xué)問(wèn)題,而且有局限性,其中的一個(gè)限制是對(duì)數(shù)據(jù)的依賴。AI算法需要采用大量高質(zhì)量的數(shù)據(jù)才能得到有效的訓(xùn)練。在AI中,需要更多更好的數(shù)據(jù)進(jìn)行訓(xùn)練。相比之下,一個(gè)人只需要通過(guò)一個(gè)例子就能學(xué)到更多的知識(shí),也就是人更具備舉一反三的能力。
AI系統(tǒng)的普及應(yīng)用需要滿足以下條件中的一個(gè)或幾個(gè):
(1)擴(kuò)展假設(shè)是正確的(簡(jiǎn)單地增加更多的數(shù)據(jù)和計(jì)算將產(chǎn)生人工通用智能(AGI))。
(2)與生物路徑(例如飛機(jī)實(shí)現(xiàn)飛行,但設(shè)計(jì)得并不像鳥(niǎo)類)相比,大型語(yǔ)言模型(LLM)代表了一條可行的通用智能替代路徑。
(3)需要新的或創(chuàng)新的算法和架構(gòu),使AI系統(tǒng)能夠從一個(gè)或幾個(gè)例子中學(xué)習(xí)任何知識(shí)(這樣的系統(tǒng)可能需要一個(gè)有凝聚力的世界模型和虛擬/物理體現(xiàn))。
我們從AI那里學(xué)到了什么?
AI雖然功能強(qiáng)大,令人敬畏,但它也僅僅是一套基于公認(rèn)的數(shù)學(xué)原理、概率和統(tǒng)計(jì)學(xué)的優(yōu)化算法。目前還不清楚,一個(gè)融入AI的信息處理系統(tǒng)在什么時(shí)候會(huì)成為一個(gè)完全實(shí)現(xiàn)的有意識(shí)的數(shù)字生物,而且它的能力超過(guò)了人類的思維。然而,有一點(diǎn)是明確的,我們正在進(jìn)入一個(gè)新時(shí)代,而不斷增加的數(shù)據(jù)和計(jì)算資源正在改變我們所知道的世界。