Python實現決策樹算法的原理與實現方式-魔扣目錄

日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告：魔扣目錄網為廣大站長提供免費收錄網站服務，提交前請做好本站友鏈：【網站目錄：http://www.ylptlb.cn 】，免友鏈快審服務（50元/站），

網站：51998
待審：31
小程序：12
文章：1030137
會員：747

首頁 > 新聞資訊 > IT業界 >正文

Python實現決策樹算法的原理與實現方式

發布時間：2024-03-08 22:27:05 作者：網友整理

決策樹算法屬于監督學習算法的范疇，適用于連續和分類輸出變量，通常會被用于解決分類和回歸問題。

決策樹是一種類似流程圖的樹結構，其中每個內部節點表示對屬性的測試，每個分支表示測試的結果，每個節點都對應一個類標簽。

決策樹算法思路

開始，將整個訓練集視為根。

對于信息增益，假設屬性是分類的，對于基尼指數，假設屬性是連續的。

在屬性值的基礎上，記錄被遞歸地分布。

使用統計方法將屬性排序為根節點。

找到最佳屬性并將其放在樹的根節點上。

現在，將數據集的訓練集拆分為子集。在制作子集時，請確保訓練數據集的每個子集都應具有相同的屬性值。

通過在每個子集上重復1和2來查找所有分支中的葉節點。

Python實現決策樹算法

需要經歷建設和運營兩個階段：

建設階段，預處理數據集。使用Python sklearn包從訓練和測試中拆分數據集。訓練分類器。

運營階段，作出預測。計算準確度。

數據導入，為了導入和操作數據，我們使用了python中提供的pandas包。

在這里，我們使用的URL直接從UCI站點獲取數據集，無需下載數據集。當您嘗試在系統上運行此代碼時，請確保系統應具有活動的Internet連接。

由于數據集由“，”分隔，所以我們必須將sep參數的值作為傳遞。

另一件事是注意數據集不包含標頭，因此我們將Header參數的值作為none傳遞。如果我們不傳遞header參數，那么它將把數據集的第一行視為header。

數據切片，在訓練模型之前，我們必須將數據集拆分為訓練和測試數據集。

為了分割數據集進行訓練和測試，我們使用了sklearn模塊train_test_split

首先，我們必須將目標變量與數據集中的屬性分開。

X=balance_data.values[:,1:5]
Y=balance_data.values[:,0]

登錄后復制

以上是分隔數據集的代碼行。變量X包含屬性，而變量Y包含數據集的目標變量。

下一步是拆分數據集以用于訓練和測試目的。

X_train,X_test,y_train,y_test=train_test_split(
X,Y,test_size=0.3,random_state=100)

登錄后復制

上一行拆分數據集以進行訓練和測試。由于我們在訓練和測試之間以70:30的比例拆分數據集，因此我們將test_size參數的值傳遞為0.3。

random_state變量是用于隨機采樣的偽隨機數生成器狀態。

分享到：

標簽：算法的概念

網友整理

注冊時間：

網站：5 個小程序：0 個文章：12 篇

51998
網站
12
小程序
1030137
文章
747
會員

趕快注冊賬號，推廣您的網站吧！

文章分類

熱門網站

各百科-專業百科問答知識名網站 m.geelcn.com
免費軟件,綠色軟件園,手機軟件下載,熱門游戲下載中心-中當網 m.deelcn.com
魔扣科技 www.ylptlb.cn
體育新聞_國際體育資訊_全球體育賽事-中名網 www.feelcn.com/tiyu/tiyuxinwen/
食品安全_健康飲食_舌尖上的安全-中名網 www.feelcn.com/shenghuo/shipinanquan/
中合網 www.heelcn.com
中當網 www.deelcn.com
魔扣網站維護代運營 www.ylptlb.cn/tg
中合網-健康養生知識科普名站 m.heelcn.com
各百科 www.geelcn.com

數獨大挑戰2018-06-03

數獨一種數學游戲，玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題，題庫，初中，高中，大學四六

運動步數有氧達人2018-06-03

記錄運動步數，積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定