日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

本次主題是隨機森林,杰里米(講師)提供了一些基本信息以及使用Jupyter Notebook的提示和技巧。

隨機森林算法

 

Jeremy談到的一些重要的事情是,數據科學并不等同于軟件工程。 在數據科學中,我們做的是設計模型。 雖然軟件工程有自己的一套實踐,但數據科學也有自己的一套最佳實踐。

模型構建和原型設計需要一個交互的環境,是一個迭代的過程。 我們建立一個模型。 然后,我們采取措施來改善它。 重復直到我們對結果滿意為止。

隨機森林

 

我聽說過“隨機森林”這個詞,我知道它是現有的機器學習技術之一,但是老實說,我從來沒有想過要去了解它。 我一直熱衷于更多地了解深度學習技術。

從這次演講中,我了解到隨機森林確實很棒。

它就像一個通用的機器學習技術,既可以用于回歸,也可以用于分類。 這意味著你可以使用隨機森林來預測股票價格以及對給定的醫療數據樣本進行分類。

一般來說,隨機森林模型不會過擬合,即使它會,它也很容易阻止過擬合。

對于隨機森林模型,不需要單獨的驗證集。

隨機森林只有一些統計假設。 它也不假設你的數據是正態分布的,也不假設這些關系是線性的。

它只需要很少的特征工程。

因此,如果你是機器學習的新手,它可以是一個很好的起點。

其他概念

維數詛咒是一個概念,意思是你擁有的數據特征越多,數據點就會越分散。 這意味著兩點之間的距離沒有意義。

Jeremy確信,在實踐中,情況并非如此,事實上,你的數據擁有的特征越多,對模型的訓練效果就越好。

沒有免費午餐定理是這樣一個概念:沒有一個模型可以完美地適用于任何類型的數據。

技巧和竅門

  1. 你可以在Jupyter Notebook中使用!來執行bash命令,例如。
!ls 
!mkdir new_dr
  1. 在Python 3.6中追加字符串的新方法。
name = 'Sabina'
print(f'Hello {name}')no_of_new_msg = 11
print(f'Hello {name}, you have {no_of_new_msg} new messages')
  1. 不需要離開Jupyter notebook就可以查看python函數。在函數名前使用?獲取它的文檔。
from sklearn.ensemble import RandomForestClassifier?RandomForestClassifier.fit()
  1. 如果你想閱讀源代碼,可以使用??在函數名稱前。
from sklearn.ensemble import RandomForestClassifier??RandomForestClassifier.fit()
  1. 通過使用to_feather方法保存處理過的數據集,將數據集以存儲在RAM中的相同格式保存到磁盤。可以使用read_feather方法從保存的文件中讀取數據。注意,為了使用這些方法,你需要安feather-format庫。
import pandasdf = pd.DataFrame()
df.to_feather('filename')saved_df= pd.read_feather('filename')

分享到:
標簽:算法
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定