隨機(jī)森林算法-魔扣目錄

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網(wǎng)為廣大站長(zhǎng)提供免費(fèi)收錄網(wǎng)站服務(wù)，提交前請(qǐng)做好本站友鏈：【網(wǎng)站目錄：http://www.ylptlb.cn 】，免友鏈快審服務(wù)（50元/站），

網(wǎng)站：51998
待審：31
小程序：12
文章：1030137
會(huì)員：747

首頁(yè) > 新聞資訊 > IT業(yè)界 >正文

隨機(jī)森林算法

發(fā)布時(shí)間：2023-07-03 15:45:03 作者：網(wǎng)友整理

本次主題是隨機(jī)森林，杰里米(講師)提供了一些基本信息以及使用Jupyter Notebook的提示和技巧。

Jeremy談到的一些重要的事情是，數(shù)據(jù)科學(xué)并不等同于軟件工程。在數(shù)據(jù)科學(xué)中，我們做的是設(shè)計(jì)模型。雖然軟件工程有自己的一套實(shí)踐，但數(shù)據(jù)科學(xué)也有自己的一套最佳實(shí)踐。

模型構(gòu)建和原型設(shè)計(jì)需要一個(gè)交互的環(huán)境，是一個(gè)迭代的過(guò)程。我們建立一個(gè)模型。然后，我們采取措施來(lái)改善它。重復(fù)直到我們對(duì)結(jié)果滿意為止。

隨機(jī)森林

我聽(tīng)說(shuō)過(guò)“隨機(jī)森林”這個(gè)詞，我知道它是現(xiàn)有的機(jī)器學(xué)習(xí)技術(shù)之一，但是老實(shí)說(shuō)，我從來(lái)沒(méi)有想過(guò)要去了解它。我一直熱衷于更多地了解深度學(xué)習(xí)技術(shù)。

從這次演講中，我了解到隨機(jī)森林確實(shí)很棒。

它就像一個(gè)通用的機(jī)器學(xué)習(xí)技術(shù)，既可以用于回歸，也可以用于分類(lèi)。這意味著你可以使用隨機(jī)森林來(lái)預(yù)測(cè)股票價(jià)格以及對(duì)給定的醫(yī)療數(shù)據(jù)樣本進(jìn)行分類(lèi)。

一般來(lái)說(shuō)，隨機(jī)森林模型不會(huì)過(guò)擬合，即使它會(huì)，它也很容易阻止過(guò)擬合。

對(duì)于隨機(jī)森林模型，不需要單獨(dú)的驗(yàn)證集。

隨機(jī)森林只有一些統(tǒng)計(jì)假設(shè)。它也不假設(shè)你的數(shù)據(jù)是正態(tài)分布的，也不假設(shè)這些關(guān)系是線性的。

它只需要很少的特征工程。

因此，如果你是機(jī)器學(xué)習(xí)的新手，它可以是一個(gè)很好的起點(diǎn)。

其他概念

維數(shù)詛咒是一個(gè)概念，意思是你擁有的數(shù)據(jù)特征越多，數(shù)據(jù)點(diǎn)就會(huì)越分散。這意味著兩點(diǎn)之間的距離沒(méi)有意義。

Jeremy確信，在實(shí)踐中，情況并非如此，事實(shí)上，你的數(shù)據(jù)擁有的特征越多，對(duì)模型的訓(xùn)練效果就越好。

沒(méi)有免費(fèi)午餐定理是這樣一個(gè)概念:沒(méi)有一個(gè)模型可以完美地適用于任何類(lèi)型的數(shù)據(jù)。

技巧和竅門(mén)

你可以在Jupyter Notebook中使用!來(lái)執(zhí)行bash命令，例如。

!ls 
!mkdir new_dr

在Python 3.6中追加字符串的新方法。

name = 'Sabina'
print(f'Hello {name}')no_of_new_msg = 11
print(f'Hello {name}, you have {no_of_new_msg} new messages')

不需要離開(kāi)Jupyter notebook就可以查看python函數(shù)。在函數(shù)名前使用?獲取它的文檔。

from sklearn.ensemble import RandomForestClassifier?RandomForestClassifier.fit()

如果你想閱讀源代碼，可以使用??在函數(shù)名稱(chēng)前。

from sklearn.ensemble import RandomForestClassifier??RandomForestClassifier.fit()

通過(guò)使用to_feather方法保存處理過(guò)的數(shù)據(jù)集，將數(shù)據(jù)集以存儲(chǔ)在RAM中的相同格式保存到磁盤(pán)。可以使用read_feather方法從保存的文件中讀取數(shù)據(jù)。注意，為了使用這些方法，你需要安feather-format庫(kù)。

import pandasdf = pd.DataFrame()
df.to_feather('filename')saved_df= pd.read_feather('filename')

分享到：

標(biāo)簽：算法

網(wǎng)友整理

注冊(cè)時(shí)間：

網(wǎng)站：5 個(gè) 小程序：0 個(gè) 文章：12 篇

51998
網(wǎng)站
12
小程序
1030137
文章
747
會(huì)員

趕快注冊(cè)賬號(hào)，推廣您的網(wǎng)站吧！

文章分類(lèi)

數(shù)獨(dú)大挑戰(zhàn)2018-06-03

數(shù)獨(dú)一種數(shù)學(xué)游戲，玩家需要根據(jù)9

答題星2018-06-03

您可以通過(guò)答題星輕松地創(chuàng)建試卷

全階人生考試2018-06-03

各種考試題，題庫(kù)，初中，高中，大學(xué)四六

運(yùn)動(dòng)步數(shù)有氧達(dá)人2018-06-03

記錄運(yùn)動(dòng)步數(shù)，積累氧氣值。還可偷

每日養(yǎng)生app2018-06-03

每日養(yǎng)生,天天健康

體育訓(xùn)練成績(jī)?cè)u(píng)定2018-06-03

通用課目體育訓(xùn)練成績(jī)?cè)u(píng)定