1. 程式人生 > 實用技巧 >SPSS實現快速聚類(K-Means/K-均值聚類)

SPSS實現快速聚類(K-Means/K-均值聚類)

總目錄:SPSS學習整理

SPSS實現快速聚類(K-Means/K-均值聚類)


目的

利用K均值聚類對資料快速分類

適用情景

資料處理

在這裡插入圖片描述

SPSS操作

分析——分類——K-均值聚類
在這裡插入圖片描述
在這裡插入圖片描述

最大迭代次數根據資料量,分類數量,電腦情況自己調整,能選多點就把上限調高點。
在這裡插入圖片描述
在這裡插入圖片描述

SPSS輸出結果分析

在這裡插入圖片描述
在資料集最右兩列儲存了該個案的分類結果與到聚類中心的距離。
在這裡插入圖片描述
由於沒有自定義初始中心,系統設定了三個。
在這裡插入圖片描述
迭代9次後中心值不變。
在這裡插入圖片描述
最終個三個聚類中心以及他們之間的距離
在這裡插入圖片描述
兩個變數的顯著性都小於0.05,說明這兩個變數能夠很好的區分各類
在這裡插入圖片描述
顯示每個類有多少個案

在這裡插入圖片描述
由於只有兩個維度,可以很好的用Tableau展示分類效果,這張圖為原始資料散點圖,橫軸:當前薪資;豎軸:初始薪資
在這裡插入圖片描述
將分類好後的資料組QCL_1(個案分類編號)進行著色,得到上圖,可以觀察到Tableau很好得把資料分成了三類。

注意:K-均值聚類可能陷入區域性最優解,產生原因和解決辦法可以百度

知識點