您好,登錄后才能下訂單哦!
小編給大家分享一下boosting和bootstrap區(qū)別有哪些,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!
bootstrap、boosting是機(jī)器學(xué)習(xí)中幾種常用的重采樣方法。其中bootstrap重采樣方法主要用于統(tǒng)計(jì)量的估計(jì),boosting方法則主要用于多個(gè)子分類器的組合。
bootstrap:估計(jì)統(tǒng)計(jì)量的重采樣方法
bootstrap方法是從大小為n的原始訓(xùn)練數(shù)據(jù)集DD中隨機(jī)選擇n個(gè)樣本點(diǎn)組成一個(gè)新的訓(xùn)練集,這個(gè)選擇過(guò)程獨(dú)立重復(fù)B次,然后用這B個(gè)數(shù)據(jù)集對(duì)模型統(tǒng)計(jì)量進(jìn)行估計(jì)(如均值、方差等)。由于原始數(shù)據(jù)集的大小就是n,所以這B個(gè)新的訓(xùn)練集中不可避免的會(huì)存在重復(fù)的樣本。
統(tǒng)計(jì)量的估計(jì)值定義為獨(dú)立的B個(gè)訓(xùn)練集上的估計(jì)值θbθb的平均:
boosting:
boosting依次訓(xùn)練k個(gè)子分類器,最終的分類結(jié)果由這些子分類器投票決定。
首先從大小為n的原始訓(xùn)練數(shù)據(jù)集中隨機(jī)選取n1n1個(gè)樣本訓(xùn)練出第一個(gè)分類器,記為C1C1,然后構(gòu)造第二個(gè)分類器C2C2的訓(xùn)練集D2D2,要求:D2D2中一半樣本能被C1C1正確分類,而另一半樣本被C1C1錯(cuò)分。
接著繼續(xù)構(gòu)造第三個(gè)分類器C3C3的訓(xùn)練集D3D3,要求:C1C1、C2C2對(duì)D3D3中樣本的分類結(jié)果不同。剩余的子分類器按照類似的思路進(jìn)行訓(xùn)練。
boosting構(gòu)造新訓(xùn)練集的主要原則是使用最富信息的樣本。
看完了這篇文章,相信你對(duì)boosting和bootstrap區(qū)別有哪些有了一定的了解,想了解更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。