日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網(wǎng)為廣大站長提供免費(fèi)收錄網(wǎng)站服務(wù),提交前請做好本站友鏈:【 網(wǎng)站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(wù)(50元/站),

點(diǎn)擊這里在線咨詢客服
新站提交
  • 網(wǎng)站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會(huì)員:747

大數(shù)據(jù)時(shí)代,機(jī)器學(xué)習(xí)算法該如何升級?

 

文 /楊曉寧

隨著產(chǎn)業(yè)界數(shù)據(jù)量的爆炸式增長,大數(shù)據(jù)概念受到越來越多的關(guān)注。由于大數(shù)據(jù)的海量、復(fù)雜多樣、變化快的特性,對于大數(shù)據(jù)環(huán)境下的應(yīng)用問題,傳統(tǒng)的小數(shù)據(jù)上的機(jī)器學(xué)習(xí)算法很多已不再適用。因此,研究大數(shù)據(jù)環(huán)境下的機(jī)器學(xué)習(xí)算法成為學(xué)術(shù)界和產(chǎn)業(yè)界共同關(guān)注的話題。

傳統(tǒng)機(jī)器學(xué)習(xí)的問題主要包括如下4個(gè)方面:理解并模擬人類的學(xué)習(xí)過程;針對計(jì)算機(jī)系統(tǒng)和人類用戶之間的自然語言接口的研究;針對不完全的信息進(jìn)行推理的能力,及自動(dòng)規(guī)劃的問題;構(gòu)造可發(fā)現(xiàn)新事物的程序。

傳統(tǒng)機(jī)器學(xué)習(xí)面臨的一個(gè)新挑戰(zhàn)是如何處理大數(shù)據(jù)。由于現(xiàn)有的機(jī)器學(xué)習(xí)算法是基于內(nèi)存的,大數(shù)據(jù)卻無法裝載進(jìn)計(jì)算機(jī)內(nèi)存,故現(xiàn)有的諸多算法不能處理大數(shù)據(jù)。如何讓新機(jī)器學(xué)習(xí)算法適應(yīng)大數(shù)據(jù)處理需求,是大數(shù)據(jù)時(shí)代的研究熱點(diǎn)之一。

數(shù)據(jù)分治與并行處理策略是大數(shù)據(jù)處理的基本策略,尤其是近年來在分布式和并行計(jì)算有很大發(fā)展的情況下,分治策略顯得尤為重要。一般來說,數(shù)據(jù)中不同樣本對學(xué)習(xí)結(jié)果的重要程度并不相同,一些冗余和噪音數(shù)據(jù)不僅造成大量的存儲耗費(fèi),降低學(xué)習(xí)運(yùn)行效率,還會(huì)影響學(xué)習(xí)進(jìn)度,因此更傾向于依據(jù)一定的性能標(biāo)準(zhǔn)(如保持樣本分布、拓?fù)浣Y(jié)構(gòu)以及保持分類精度等)選擇代表性樣本形成原樣本空間的子集,之后在子集上構(gòu)造學(xué)習(xí)方法,完成學(xué)習(xí)任務(wù)。

在數(shù)據(jù)挖掘、文檔分類和多媒體索引等新興領(lǐng)域中,所面臨的數(shù)據(jù)往往是大數(shù)據(jù)集,其中包含的屬性和記錄數(shù)據(jù)都很大,導(dǎo)致處理算法的執(zhí)行效率低下,通過屬性選擇可剔除無關(guān)屬性,增加分析任務(wù)的有效性,從而提高模型精度,減少運(yùn)行時(shí)間。

魯棒是Robust的譯音,是在異常和危險(xiǎn)情況下系統(tǒng)生存的能力。比如說,計(jì)算機(jī)軟件在輸入錯(cuò)誤、磁盤故障、網(wǎng)絡(luò)過載或有意攻擊情況下,能否不死機(jī)、不崩潰,也指控制系統(tǒng)在一定結(jié)構(gòu)、大小的參數(shù)攝動(dòng)下,維持其他某些性能的特性。

在監(jiān)督學(xué)習(xí)中面臨的挑戰(zhàn)是如何處理大數(shù)據(jù),面臨的兩大瓶頸是計(jì)算密集幾乎不能用于大規(guī)模數(shù)據(jù)集,魯棒和非參數(shù)的置信區(qū)間的擬合預(yù)測往往是未知的。

國內(nèi)外學(xué)者已開始對機(jī)器學(xué)習(xí)算法進(jìn)行改進(jìn),針對大規(guī)模數(shù)據(jù)的分類問題,在增量核主成分分析和基于共軛梯度的最小二乘支持向量機(jī)算法基礎(chǔ)上,大數(shù)據(jù)領(lǐng)域?qū)<铱返忍岢鲞m用于大數(shù)據(jù)特征提取和分類算法。該算法所需內(nèi)存較少,無需存儲較大矩陣,可更好地解決大規(guī)模數(shù)據(jù)分類問題。類似改進(jìn)還有很多,常用的改進(jìn)方法有隨機(jī)梯度下降、小批量梯度下降、在線學(xué)習(xí)等。

(作者單位:北京弘治銳龍教育科技有限公司)

分享到:
標(biāo)簽:機(jī)器 學(xué)習(xí)
用戶無頭像

網(wǎng)友整理

注冊時(shí)間:

網(wǎng)站:5 個(gè)   小程序:0 個(gè)  文章:12 篇

  • 51998

    網(wǎng)站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會(huì)員

趕快注冊賬號,推廣您的網(wǎng)站吧!
最新入駐小程序

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲,玩家需要根據(jù)9

答題星2018-06-03

您可以通過答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù),積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績評定2018-06-03

通用課目體育訓(xùn)練成績評定