標準化和歸一化
*****************************歸一化*******************************
1)把資料變成(0,1)之間的小數
2)把有量綱表示式變成無量綱表示式
歸一化演算法有:
1.線性轉換
y=(x-MinValue)/(MaxValue-MinValue
2.對數函式轉換:
y=log10(x)
3.反餘切函式轉換
y=atan(x)*2/PI
4.線性也與對數函式結合
式(1)將輸入值換算為[-1,1]區間的值,
在輸出層用式(2)換算回初始值,其中 和分別表示訓練樣本集中負荷的最大值和最小值。
**************************標準化****************************************
1)把資料按比例縮放,使之落入一個小的空間裡
1.最小-最大規範化(線性變換)
y=( (x-MinValue) / (MaxValue-MinValue) )(new_MaxValue-new_MinValue)+new_minValue
2.z-score規範化(或零-均值規範化)
y=(x-X的平均值)/X的標準差
優點:當X的最大值和最小值未知,或孤立點左右了最大-最小規範化時, 該方法有用
3.小數定標規範化:通過移動X的小數位置來進行規範化
y= x/10的j次方 (其中,j使得Max(|y|) <1的最小整數
4.對數Logistic模式:
新資料=1/(1+e^(-原資料))
5.模糊量化模式:
新資料=1/2+1/2sin[派3.1415/(極大值-極小值)*
(X-(極大值-極小值)/2) ] X為原資料
簡單來說,標準化是依照特徵矩陣的列處理資料,其通過求z-score的方法,將樣本的特徵值轉換到同一量綱下。歸一化是依照特徵矩陣的行處理資料,其目的在於樣本向量在點乘運算或其他核函式計算相似性時,擁有統一的標準,也就是說都轉化為“單位向量‘’。