R語言分類算法中隨機森林是什么意思

發(fā)布時間：2021-11-22 10:50:31 來源：億速云閱讀：228 作者：柒染欄目：云計算

本篇文章為大家展示了R語言分類算法中隨機森林是什么意思，內(nèi)容簡明扼要并且容易理解，絕對能使你眼前一亮，通過這篇文章的詳細介紹希望你能有所收獲。

1.原理分析:
隨機森林是通過自助法(boot-strap)重采樣技術(shù),從原始訓練樣本集N中有放回地重復隨機抽取k個樣本生成新的訓練集樣本集合,然后根據(jù)自助樣本集生成k個決策樹組成的隨機森林,新數(shù)據(jù)的分類結(jié)果按照決策樹投票多少形成的分數(shù)而定.
通俗的理解為由許多棵決策樹組成的森林,而每個樣本需要經(jīng)過每棵樹進行預測,然后根據(jù)所有決策樹的預測結(jié)果最后來確定整個隨機森林的預測結(jié)果.隨機森林中的每一顆決策樹都為二叉樹,其生成遵循自頂向下的遞歸分裂原則,即從根節(jié)點開始依次對訓練集進行劃分.在二叉樹中,根節(jié)點包含全部訓練數(shù)據(jù),按照節(jié)點不純度最小原則,分裂為左節(jié)點和右節(jié)點,他們分別包含訓數(shù)據(jù)的一個子集,按照同樣的規(guī)則,節(jié)點繼續(xù)分裂,直到滿足分支停止規(guī)則,停止生長.
1.首先我們用N來表示原始訓練集樣本的個數(shù),用M來表示變量的數(shù)目.
2.其次我們需要確定一個定值m,該值被用來決定當在一個節(jié)點上做決定時,會使用到多少個變量.m

fit_rf=randomForest(Species~.,data=data_train,mtry=4,importance=TRUE,ntree=1000)fit_rf[1:length(fit_rf)]

R語言分類算法中隨機森林是什么意思

2)作圖
R語言分類算法中隨機森林是什么意思

上述內(nèi)容就是R語言分類算法中隨機森林是什么意思，你們學到知識或技能了嗎？如果還想學到更多技能或者豐富自己的知識儲備，歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細節(jié)

R語言分類算法中隨機森林是什么意思

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標簽