溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

R語言歸一化處理的案例分析

發(fā)布時(shí)間:2021-03-17 09:18:11 來源:億速云 閱讀:624 作者:小新 欄目:開發(fā)技術(shù)

這篇文章主要介紹了R語言歸一化處理的案例分析,具有一定借鑒價(jià)值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。

歸一化就是要把你需要處理的數(shù)據(jù)經(jīng)過處理后(通過某種算法)限制在你需要的一定范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便,其次是保正程序運(yùn)行時(shí)收斂加快。

R語言中的歸一化函數(shù):scale

數(shù)據(jù)歸一化包括數(shù)據(jù)的中心化和數(shù)據(jù)的標(biāo)準(zhǔn)化。

1. 數(shù)據(jù)的中心化

所謂數(shù)據(jù)的中心化是指數(shù)據(jù)集中的各項(xiàng)數(shù)據(jù)減去數(shù)據(jù)集的均值。
例如有數(shù)據(jù)集1, 2, 3, 6, 3,其均值為3,那么中心化之后的數(shù)據(jù)集為1-3,2-3,3-3,6-3,3-3,即:-2,-1,0,3,0

2. 數(shù)據(jù)的標(biāo)準(zhǔn)化

所謂數(shù)據(jù)的標(biāo)準(zhǔn)化是指中心化之后的數(shù)據(jù)在除以數(shù)據(jù)集的標(biāo)準(zhǔn)差,即數(shù)據(jù)集中的各項(xiàng)數(shù)據(jù)減去數(shù)據(jù)集的均值再除以數(shù)據(jù)集的標(biāo)準(zhǔn)差。
例如有數(shù)據(jù)集1, 2, 3, 6, 3,其均值為3,其標(biāo)準(zhǔn)差為1.87,那么標(biāo)準(zhǔn)化之后的數(shù)據(jù)集為(1-3)/1.87,(2-3)/1.87,(3-3)/1.87,(6-3)/1.87,(3-3)/1.87,即:-1.069,-0.535,0,1.604,0

數(shù)據(jù)中心化和標(biāo)準(zhǔn)化的意義是一樣的,為了消除量綱對(duì)數(shù)據(jù)結(jié)構(gòu)的影響。在R語言中可以使用scale方法來對(duì)數(shù)據(jù)進(jìn)行中心化和標(biāo)準(zhǔn)化。

scale函數(shù)是將一組數(shù)進(jìn)行處理,默認(rèn)情況下是將一組數(shù)的每個(gè)數(shù)都減去這組數(shù)的平均值后再除以這組數(shù)的標(biāo)準(zhǔn)差。

其中有兩個(gè)參數(shù):
center=TRUE,默認(rèn)的,是將一組數(shù)中每個(gè)數(shù)減去平均值,若為false,則不減平均值;
scale=TRUE,默認(rèn)的,是將一組數(shù)中每個(gè)數(shù)除以標(biāo)準(zhǔn)差。

R語言歸一化處理的案例分析

scale默認(rèn)情況下:將一組數(shù)的每個(gè)數(shù)都減去這組數(shù)的平均值后再除以這組數(shù)的標(biāo)準(zhǔn)差。

> scale(ss)
      [,1]
[1,] -1.3805850
[2,] -0.6371931
[3,] 0.1061988
[4,] 0.8495908
[5,] 1.5929827
[6,] 0.1061988
[7,] -0.6371931

attr(,"scaled:center")
[1] 2.857143

attr(,"scaled:scale")
[1] 1.345185

感謝你能夠認(rèn)真閱讀完這篇文章,希望小編分享的“R語言歸一化處理的案例分析”這篇文章對(duì)大家有幫助,同時(shí)也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識(shí)等著你來學(xué)習(xí)!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI