1. 程式人生 > >(二)數據預處理

(二)數據預處理

info 偏差 填充 ima 平滑 回歸 img 全局常量 AR

數據清洗

  • 數值缺失

1.略去該組數據

2.數值填充:1)隨機數;2)統一的全局常量,如:UNKNOWN;3)均值、中值;4)按類別的中值、均值;5)回歸、決策樹等得到的預測值;

  • 噪聲數據的平滑:隨機噪聲或偏差引起噪聲

1.裝箱法:按鄰值實現

技術分享圖片

2.擬合回歸函數以平滑數據

3.異常數據分析:在聚合後簇外的數據認為異常

(二)數據預處理