溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

python實現(xiàn)幾種歸一化方法(Normalization Method)

發(fā)布時間:2020-10-18 16:55:48 來源:腳本之家 閱讀:1223 作者:Bin_Xia 欄目:開發(fā)技術(shù)

數(shù)據(jù)歸一化問題是數(shù)據(jù)挖掘中特征向量表達(dá)時的重要問題,當(dāng)不同的特征成列在一起的時候,由于特征本身表達(dá)方式的原因而導(dǎo)致在絕對數(shù)值上的小數(shù)據(jù)被大數(shù)據(jù)“吃掉”的情況,這個時候我們需要做的就是對抽取出來的features vector進(jìn)行歸一化處理,以保證每個特征被分類器平等對待。下面我描述幾種常見的Normalization Method,并提供相應(yīng)的python實現(xiàn)(其實很簡單):

1、(0,1)標(biāo)準(zhǔn)化:

這是最簡單也是最容易想到的方法,通過遍歷feature vector里的每一個數(shù)據(jù),將Max和Min的記錄下來,并通過Max-Min作為基數(shù)(即Min=0,Max=1)進(jìn)行數(shù)據(jù)的歸一化處理:

python實現(xiàn)幾種歸一化方法(Normalization Method)

LaTex:{x}_{normalization}=\frac{x-Min}{Max-Min}

Python實現(xiàn):

def MaxMinNormalization(x,Max,Min):
	x = (x - Min) / (Max - Min);
	return x;

找大小的方法直接用np.max()和np.min()就行了,盡量不要用python內(nèi)建的max()和min(),除非你喜歡用List管理數(shù)字。

2、Z-score標(biāo)準(zhǔn)化:

這種方法給予原始數(shù)據(jù)的均值(mean)和標(biāo)準(zhǔn)差(standard deviation)進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化。經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,這里的關(guān)鍵在于復(fù)合標(biāo)準(zhǔn)正態(tài)分布,個人認(rèn)為在一定程度上改變了特征的分布,關(guān)于使用經(jīng)驗上歡迎討論,我對這種標(biāo)準(zhǔn)化不是非常地熟悉,轉(zhuǎn)化函數(shù)為:

python實現(xiàn)幾種歸一化方法(Normalization Method)

LaTex:{x}_{normalization}=\frac{x-\mu }{\sigma }

Python實現(xiàn):

def Z_ScoreNormalization(x,mu,sigma):
	x = (x - mu) / sigma;
	return x;

這里一樣,mu(即均值)用np.average(),sigma(即標(biāo)準(zhǔn)差)用np.std()即可。

3、Sigmoid函數(shù)

Sigmoid函數(shù)是一個具有S形曲線的函數(shù),是良好的閾值函數(shù),在(0, 0.5)處中心對稱,在(0, 0.5)附近有比較大的斜率,而當(dāng)數(shù)據(jù)趨向于正無窮和負(fù)無窮的時候,映射出來的值就會無限趨向于1和0,是個人非常喜歡的“歸一化方法”,之所以打引號是因為我覺得Sigmoid函數(shù)在閾值分割上也有很不錯的表現(xiàn),根據(jù)公式的改變,就可以改變分割閾值,這里作為歸一化方法,我們只考慮(0, 0.5)作為分割閾值的點的情況:

python實現(xiàn)幾種歸一化方法(Normalization Method)

python實現(xiàn)幾種歸一化方法(Normalization Method)

LaTex:{x}_{normalization}=\frac{1}{1+{e}^{-x}}

Python實現(xiàn):

def sigmoid(X,useStatus):
	if useStatus:
		return 1.0 / (1 + np.exp(-float(X)));
	else:
		return float(X);

這里useStatus管理是否使用sigmoid的狀態(tài),方便調(diào)試使用。

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持億速云。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI