溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

boosting和bootstrap區(qū)別有哪些

發(fā)布時(shí)間:2020-09-10 10:37:48 來(lái)源:億速云 閱讀:222 作者:小新 欄目:編程語(yǔ)言

小編給大家分享一下boosting和bootstrap區(qū)別有哪些,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!

bootstrap、boosting是機(jī)器學(xué)習(xí)中幾種常用的重采樣方法。其中bootstrap重采樣方法主要用于統(tǒng)計(jì)量的估計(jì),boosting方法則主要用于多個(gè)子分類器的組合。

bootstrap:估計(jì)統(tǒng)計(jì)量的重采樣方法

bootstrap方法是從大小為n的原始訓(xùn)練數(shù)據(jù)集DD中隨機(jī)選擇n個(gè)樣本點(diǎn)組成一個(gè)新的訓(xùn)練集,這個(gè)選擇過(guò)程獨(dú)立重復(fù)B次,然后用這B個(gè)數(shù)據(jù)集對(duì)模型統(tǒng)計(jì)量進(jìn)行估計(jì)(如均值、方差等)。由于原始數(shù)據(jù)集的大小就是n,所以這B個(gè)新的訓(xùn)練集中不可避免的會(huì)存在重復(fù)的樣本。

統(tǒng)計(jì)量的估計(jì)值定義為獨(dú)立的B個(gè)訓(xùn)練集上的估計(jì)值θbθb的平均:

boosting和bootstrap區(qū)別有哪些

boosting:

boosting依次訓(xùn)練k個(gè)子分類器,最終的分類結(jié)果由這些子分類器投票決定。

首先從大小為n的原始訓(xùn)練數(shù)據(jù)集中隨機(jī)選取n1n1個(gè)樣本訓(xùn)練出第一個(gè)分類器,記為C1C1,然后構(gòu)造第二個(gè)分類器C2C2的訓(xùn)練集D2D2,要求:D2D2中一半樣本能被C1C1正確分類,而另一半樣本被C1C1錯(cuò)分。

接著繼續(xù)構(gòu)造第三個(gè)分類器C3C3的訓(xùn)練集D3D3,要求:C1C1、C2C2對(duì)D3D3中樣本的分類結(jié)果不同。剩余的子分類器按照類似的思路進(jìn)行訓(xùn)練。

boosting構(gòu)造新訓(xùn)練集的主要原則是使用最富信息的樣本。

看完了這篇文章,相信你對(duì)boosting和bootstrap區(qū)別有哪些有了一定的了解,想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI