MATLAB k-means聚類

阿新 • • 發佈：2020-09-10

聚類演算法，不是分類演算法。

分類演算法是給一個數據，然後判斷這個資料屬於已分好的類中的具體哪一類。

聚類演算法是給一大堆原始資料，然後通過演算法將其中具有相似特徵的資料聚為一類。

這裡的k-means聚類，是事先給出原始資料所含的類數，然後將含有相似特徵的資料聚為一個類中。

所有資料中還是Andrew Ng介紹的明白。

首先給出原始資料{x1,x2,...,xn}，這些資料沒有被標記的。

初始化k個隨機資料u1,u2,...,uk。這些xn和uk都是向量。

根據下面兩個公式迭代就能求出最終所有的u,這些u就是最終所有類的中心位置。

公式一：

意思就是求出所有資料和初始化的隨機資料的距離，然後找出距離每個初始資料最近的資料。

公式二：

意思就是求出所有和這個初始資料最近原始資料的距離的均值。

然後不斷迭代兩個公式，直到所有的u都不怎麼變化了，就算完成了。

先看看一些結果：

用三個二維高斯分佈資料畫出的圖：

通過對沒有標記的原始資料進行kmeans聚類得到的分類，十字是最終迭代位置：

下面是Matlab程式碼，這裡我把測試資料改為了三維了，函式是可以處理各種維度的。

main.m

 1 clear all;
 2 close all;
 3 clc;
 4 
 5 %第一類資料
 6 mu1=[0 0 0];  %均值
 7 S1=[0.3 0 0;0 0.35 0;0 0 0.3];  %協方差
 8 data1=mvnrnd(mu1,S1,100 
);   %產生高斯分佈資料
 9 
10 %%第二類資料
11 mu2=[1.25 1.25 1.25];
12 S2=[0.3 0 0;0 0.35 0;0 0 0.3];
13 data2=mvnrnd(mu2,S2,100);
14 
15 %第三個類資料
16 mu3=[-1.25 1.25 -1.25];
17 S3=[0.3 0 0;0 0.35 0;0 0 0.3];
18 data3=mvnrnd(mu3,S3,100);
19 
20 %顯示資料
21 plot3(data1(:,1),data1(:,2),data1(:,3),'+');
22 hold on;
23 plot3(data2(:,1),data2(:,2 
),data2(:,3),'r+');
24 plot3(data3(:,1),data3(:,2),data3(:,3),'g+');
25 grid on;
26 
27 %三類資料合成一個不帶標號的資料類
28 data=[data1;data2;data3];   %這裡的data是不帶標號的
29 
30 %k-means聚類
31 [u re]=KMeans(data,3);  %最後產生帶標號的資料，標號在所有資料的最後，意思就是資料再加一維度
32 [m n]=size(re);
33 
34 %最後顯示聚類後的資料
35 figure;
36 hold on;
37 for i=1:m 
38     if re(i,4)==1   
39          plot3(re(i,1),re(i,2),re(i,3),'ro'); 
40     elseif re(i,4)==2
41          plot3(re(i,1),re(i,2),re(i,3),'go'); 
42     else 
43          plot3(re(i,1),re(i,2),re(i,3),'bo'); 
44     end
45 end
46 grid on;

KMeans.m

 1 %N是資料一共分多少類
 2 %data是輸入的不帶分類標號的資料
 3 %u是每一類的中心
 4 %re是返回的帶分類標號的資料
 5 function [u re]=KMeans(data,N)   
 6     [m n]=size(data);   %m是資料個數，n是資料維數
 7     ma=zeros(n);        %每一維最大的數
 8     mi=zeros(n);        %每一維最小的數
 9     u=zeros(N,n);       %隨機初始化，最終迭代到每一類的中心位置
10     for i=1:n
11        ma(i)=max(data(:,i));    %每一維最大的數
12        mi(i)=min(data(:,i));    %每一維最小的數
13        for j=1:N
14             u(j,i)=ma(i)+(mi(i)-ma(i))*rand();  %隨機初始化，不過還是在每一維[min max]中初始化好些
15        end      
16     end
17    
18     while 1
19         pre_u=u;            %上一次求得的中心位置
20         for i=1:N
21             tmp{i}=[];      % 公式一中的x(i)-uj,為公式一實現做準備
22             for j=1:m
23                 tmp{i}=[tmp{i};data(j,:)-u(i,:)];
24             end
25         end
26         
27         quan=zeros(m,N);
28         for i=1:m        %公式一的實現
29             c=[];
30             for j=1:N
31                 c=[c norm(tmp{j}(i,:))];
32             end
33             [junk index]=min(c);
34             quan(i,index)=norm(tmp{index}(i,:));           
35         end
36         
37         for i=1:N            %公式二的實現
38            for j=1:n
39                 u(i,j)=sum(quan(:,i).*data(:,j))/sum(quan(:,i));
40            end           
41         end
42         
43         if norm(pre_u-u)<0.1  %不斷迭代直到位置不再變化
44             break;
45         end
46     end
47     
48     re=[];
49     for i=1:m
50         tmp=[];
51         for j=1:N
52             tmp=[tmp norm(data(i,:)-u(j,:))];
53         end
54         [junk index]=min(tmp);
55         re=[re;data(i,:) index];
56     end
57     
58 end

MATLAB k-means聚類

聚類演算法，不是分類演算法。分類演算法是給一個數據，然後判斷這個資料屬於已分好的類中的具體哪一類。

matlab實現K-means聚類演算法（轉載）

https://blog.csdn.net/wys7541/article/details/82153844 K-means聚類演算法的一般步驟：初始化。輸入基因表達矩陣作為物件集X，輸入指定聚類類數N，並在X中隨機選取N個物件作為初始聚類中心。設定迭代中止條件，

python基於K-means聚類演算法的影象分割

1 K-means演算法實際上，無論是從演算法思想，還是具體實現上，K-means演算法是一種很簡單的演算法。它屬於無監督分類，通過按照一定的方式度量樣本之間的相似度，通過迭代更新聚類中心，當聚類中心不再移動或移動

在Python中使用K-Means聚類和PCA主成分分析進行影象壓縮

在Python中使用K-Means聚類和PCA主成分分析進行影象壓縮各位讀者好，在這片文章中我們嘗試使用sklearn庫比較k-means聚類演算法和主成分分析（PCA）在影象壓縮上的實現和結果。壓縮影象的效果通過佔用的減少比例以及

python 程式碼實現k-means聚類分析的思路(不使用現成聚類庫)

一、實驗目標　　　　1、使用 K-means 模型進行聚類，嘗試使用不同的類別個數 K，並分析聚類結果。

k-means 聚類演算法與Python實現程式碼

k-means 聚類演算法思想先隨機選擇k個聚類中心，把集合裡的元素與最近的聚類中心聚為一類，得到一次聚類，再把每一個類的均值作為新的聚類中心重新聚類，迭代n次得到最終結果分步解析

簡單的k-means聚類

演算法步驟：在樣本中隨機選取k個樣本點充當各個簇的中心點；計算所有樣本點與各個簇中心之間的距離，然後把樣本點劃入最近的簇中；

YOLOv3中K-Means聚類出新資料集的Anchor尺寸

參考部落格：聚類kmeans演算法在yolov3中的應用 https://www.cnblogs.com/sdu20112013/p/10937717.html

Python用K-means聚類演算法進行客戶分群的實現

一、背景 1.專案描述你擁有一個超市(Supermarket Mall)。通過會員卡，你用有一些關於你的客戶的基本資料，如客戶ID，年齡，性別，年收入和消費分數。

論文題目：基於K-means聚類的三維點雲分類

論文題目：基於K-means聚類的三維點雲分類論文主要思想：先對原始點雲進行預處理保留關鍵點，密集去冗餘、稀疏進行三角形插值。再通過K-means聚類操作獲取區域性特徵，之後並行同過pointnet進行特徵提取。

關於k-means聚類演算法的原理及解析

一、k-means演算法思想：第一步，從檔案中讀取資料，點用元組表示，點集用列表表示。第二步，初始化聚類中心。首先獲取資料的長度，然後在range(0,length)這個區間上隨機產生k個不同的值,以此為下標提取出資料點，

OpenCV計算機視覺學習（12）——影象量化處理&影象取樣處理（K-Means聚類量化，區域性馬賽克處理）

如果需要處理的原圖及程式碼，請移步小編的GitHub地址　　傳送門：請點選我

YOLOV5——使用 k-means 聚類 anchorbox 資料

訓練的標註資料格式如下： [ { \"name\": \"235_2_t20201127123021723_CAM2.jpg\", \"image_height\": 6000,

K-means聚類演算法及python程式碼實現

K-means聚類演算法（事先資料並沒有類別之分！所有的資料都是一樣的） 1、概述

機器學習 - k-means聚類

k-means簡介 k-means是無監督學習下的一種聚類演算法，簡單說就是不需要資料標籤，僅靠特徵值就可以將資料分為指定的幾類。k-means演算法的核心就是通過計算每個資料點與k個質心（或重心）之間的距離，找出與各質心

拓端tecdat|R語言譜聚類、K-means聚類分析非線性環狀資料比較

原文連結：http://tecdat.cn/?p=23276 原文出處：拓端資料部落公眾號有些問題是線性的，但有些問題是非線性的。我假設，你過去的知識是從討論和解決線性問題開始的，這是一個自然的起點。對於非線性問題的解決，往

K-means聚類

專案預備 1 from numpy.random import RandomState 2 from sklearn.datasets import make_blobs 3 import matplotlib.pyplot as plt

Python機器學習的練習七：K-Means聚類和主成分分析

這部分練習涵蓋兩個吸引人的話題：K-Means聚類和主成分分析（PCA），K-Means和PCA都是無監督學習技術的例子，無監督學習問題沒有為我們提供任何標籤或者目標去學習做出預測，所以無監督演算法試圖從資料本身中學習一

K-Means聚類演算法k值選取——輪廓係數

1 # 1 匯入模組和包 2 import matplotlib.pyplot as plt #匯入繪製資料圖的資料庫 3 from sklearn.datasets import make_blobs

k-means聚類演算法原理

k-means演算法原理 k-means是一種無監督的分類演算法，簡而言之就是餵給演算法的資料是沒有標籤的，但是我們需要自己設定k值（分類數）。如顆粒影象中有四種顏色，則設立k值為4.而相反，KNN分類演算法是一種有監督的

MATLAB k-means聚類

相關推薦