k-means 聚類演算法與Python實現程式碼

阿新 • • 發佈：2020-06-02

k-means 聚類演算法思想先隨機選擇k個聚類中心，把集合裡的元素與最近的聚類中心聚為一類，得到一次聚類，再把每一個類的均值作為新的聚類中心重新聚類，迭代n次得到最終結果分步解析

一、初始化聚類中心

首先隨機選擇集合裡的一個元素作為第一個聚類中心放入容器，選擇距離第一個聚類中心最遠的一個元素作為第二個聚類中心放入容器，第三、四、、、N個同理，為了優化可以選擇距離開方做為評判標準

二、迭代聚類

依次把集合裡的元素與距離最近的聚類中心分為一類，放到對應該聚類中心的新的容器，一次聚類完成後求出新容器裡個類的均值，對該類對應的聚類中心進行更新，再次進行聚類操作，迭代n次得到理想的結果

三、視覺化展示

利用 python 第三方庫中的視覺化工具 matplotlib.pyplot 對聚類後的元素顯示（散點圖），方便檢視結果

python程式碼實現

import numpy as np
import matplotlib.pyplot as plt

# 兩點距離
def distance(e1,e2):
  return np.sqrt((e1[0]-e2[0])**2+(e1[1]-e2[1])**2)

# 集合中心
def means(arr):
  return np.array([np.mean([e[0] for e in arr]),np.mean([e[1] for e in arr])])

# arr中距離a最遠的元素，用於初始化聚類中心
def farthest(k_arr,arr):
  f = [0,0]
  max_d = 0
  for e in arr:
    d = 0
    for i in range(k_arr.__len__()):
      d = d + np.sqrt(distance(k_arr[i],e))
    if d > max_d:
      max_d = d
      f = e
  return f

# arr中距離a最近的元素，用於聚類
def closest(a,arr):
  c = arr[1]
  min_d = distance(a,arr[1])
  arr = arr[1:]
  for e in arr:
    d = distance(a,e)
    if d < min_d:
      min_d = d
      c = e
  return c


if __name__=="__main__":
  ## 生成二維隨機座標（如果有資料集就更好）
  arr = np.random.randint(100,size=(100,1,2))[:,:]

  ## 初始化聚類中心和聚類容器
  m = 5
  r = np.random.randint(arr.__len__() - 1)
  k_arr = np.array([arr[r]])
  cla_arr = [[]]
  for i in range(m-1):
    k = farthest(k_arr,arr)
    k_arr = np.concatenate([k_arr,np.array([k])])
    cla_arr.append([])

  ## 迭代聚類
  n = 20
  cla_temp = cla_arr
  for i in range(n):  # 迭代n次
    for e in arr:  # 把集合裡每一個元素聚到最近的類
      ki = 0    # 假定距離第一個中心最近
      min_d = distance(e,k_arr[ki])
      for j in range(1,k_arr.__len__()):
        if distance(e,k_arr[j]) < min_d:  # 找到更近的聚類中心
          min_d = distance(e,k_arr[j])
          ki = j
      cla_temp[ki].append(e)
    # 迭代更新聚類中心
    for k in range(k_arr.__len__()):
      if n - 1 == i:
        break
      k_arr[k] = means(cla_temp[k])
      cla_temp[k] = []

  ## 視覺化展示
  col = ['HotPink','Aqua','Chartreuse','yellow','LightSalmon']
  for i in range(m):
    plt.scatter(k_arr[i][0],k_arr[i][1],linewidth=10,color=col[i])
    plt.scatter([e[0] for e in cla_temp[i]],[e[1] for e in cla_temp[i]],color=col[i])
  plt.show()

結果展示

聚m=5類,迭代n=20次

總結

到此這篇關於k-means 聚類演算法與Python實現程式碼的文章就介紹到這了,更多相關k-means 聚類演算法python內容請搜尋我們以前的文章或繼續瀏覽下面的相關文章希望大家以後多多支援我們！

k-means 聚類演算法與Python實現程式碼

K-means聚類演算法及python程式碼實現

K-means聚類演算法（事先資料並沒有類別之分！所有的資料都是一樣的） 1、概述

Python用K-means聚類演算法進行客戶分群的實現

一、背景 1.專案描述你擁有一個超市(Supermarket Mall)。通過會員卡，你用有一些關於你的客戶的基本資料，如客戶ID，年齡，性別，年收入和消費分數。

python基於K-means聚類演算法的影象分割

1 K-means演算法實際上，無論是從演算法思想，還是具體實現上，K-means演算法是一種很簡單的演算法。它屬於無監督分類，通過按照一定的方式度量樣本之間的相似度，通過迭代更新聚類中心，當聚類中心不再移動或移動

matlab實現K-means聚類演算法（轉載）

https://blog.csdn.net/wys7541/article/details/82153844 K-means聚類演算法的一般步驟：初始化。輸入基因表達矩陣作為物件集X，輸入指定聚類類數N，並在X中隨機選取N個物件作為初始聚類中心。設定迭代中止條件，

使用 K-means 聚類演算法處理影象（Python）

K-means演算法屬於無監督分類，通過按照一定的方式度量樣本之間的相似度，通過迭代更新聚類中心，當聚類中心不再移動或移動差值小於閾值時，則就樣本分為不同的類別。

關於k-means聚類演算法的原理及解析

一、k-means演算法思想：第一步，從檔案中讀取資料，點用元組表示，點集用列表表示。第二步，初始化聚類中心。首先獲取資料的長度，然後在range(0,length)這個區間上隨機產生k個不同的值,以此為下標提取出資料點，

Thinking in SQL系列之：資料探勘K均值聚類演算法與城市分級

引言：SQL做為一種程式語言，能夠滿足各類資料處理的需要，關鍵就在於演算法與思維方式。以SQL會友，希望結交更多的資料庫、資料分析領域的朋友。

K-Means聚類演算法k值選取——輪廓係數

1 # 1 匯入模組和包 2 import matplotlib.pyplot as plt #匯入繪製資料圖的資料庫 3 from sklearn.datasets import make_blobs

k-means聚類演算法原理

k-means演算法原理 k-means是一種無監督的分類演算法，簡而言之就是餵給演算法的資料是沒有標籤的，但是我們需要自己設定k值（分類數）。如顆粒影象中有四種顏色，則設立k值為4.而相反，KNN分類演算法是一種有監督的

python 程式碼實現k-means聚類分析的思路(不使用現成聚類庫)

一、實驗目標　　　　1、使用 K-means 模型進行聚類，嘗試使用不同的類別個數 K，並分析聚類結果。

Python 非調包實現K中心聚類演算法

技術標籤：人工智慧python機器學習深度學習聚類 Python 非調包實現K中心聚類演算法

在Python中使用K-Means聚類和PCA主成分分析進行影象壓縮

在Python中使用K-Means聚類和PCA主成分分析進行影象壓縮各位讀者好，在這片文章中我們嘗試使用sklearn庫比較k-means聚類演算法和主成分分析（PCA）在影象壓縮上的實現和結果。壓縮影象的效果通過佔用的減少比例以及

Python機器學習的練習七：K-Means聚類和主成分分析

這部分練習涵蓋兩個吸引人的話題：K-Means聚類和主成分分析（PCA），K-Means和PCA都是無監督學習技術的例子，無監督學習問題沒有為我們提供任何標籤或者目標去學習做出預測，所以無監督演算法試圖從資料本身中學習一

簡單的k-means聚類

演算法步驟：在樣本中隨機選取k個樣本點充當各個簇的中心點；計算所有樣本點與各個簇中心之間的距離，然後把樣本點劃入最近的簇中；

機器學習實戰---K均值聚類演算法

一：一般K均值聚類演算法實現（一）匯入資料 import numpy as np import matplotlib.pyplot as plt

YOLOv3中K-Means聚類出新資料集的Anchor尺寸

參考部落格：聚類kmeans演算法在yolov3中的應用 https://www.cnblogs.com/sdu20112013/p/10937717.html

二分K-均值聚類演算法

#K-means聚類 from numpy import * import matplotlib.pyplot as plt plt.ion()#開啟互動模式，實時繪製

MATLAB k-means聚類

聚類演算法，不是分類演算法。分類演算法是給一個數據，然後判斷這個資料屬於已分好的類中的具體哪一類。

論文題目：基於K-means聚類的三維點雲分類

論文題目：基於K-means聚類的三維點雲分類論文主要思想：先對原始點雲進行預處理保留關鍵點，密集去冗餘、稀疏進行三角形插值。再通過K-means聚類操作獲取區域性特徵，之後並行同過pointnet進行特徵提取。

k-means 聚類演算法與Python實現程式碼

相關推薦