SPSS實現快速聚類(K-Means/K-均值聚類)
阿新 • • 發佈:2020-10-13
總目錄:SPSS學習整理
SPSS實現快速聚類(K-Means/K-均值聚類)
目的
利用K均值聚類對資料快速分類
適用情景
資料處理
SPSS操作
分析——分類——K-均值聚類
最大迭代次數根據資料量,分類數量,電腦情況自己調整,能選多點就把上限調高點。
SPSS輸出結果分析
在資料集最右兩列儲存了該個案的分類結果與到聚類中心的距離。
由於沒有自定義初始中心,系統設定了三個。
迭代9次後中心值不變。
最終個三個聚類中心以及他們之間的距離
兩個變數的顯著性都小於0.05,說明這兩個變數能夠很好的區分各類
顯示每個類有多少個案
由於只有兩個維度,可以很好的用Tableau展示分類效果,這張圖為原始資料散點圖,橫軸:當前薪資;豎軸:初始薪資
將分類好後的資料組QCL_1(個案分類編號)進行著色,得到上圖,可以觀察到Tableau很好得把資料分成了三類。
注意:K-均值聚類可能陷入區域性最優解,產生原因和解決辦法可以百度