吳恩達機器學習筆記(week 8)----聚類
阿新 • • 發佈:2018-12-20
宣告:本文只用於學習交流,若不慎侵權,請及時聯絡我,立即予以刪除
- 一 聚類
- 監督學習與無監督學習
從上面可以看出,監督學習中training資料帶有標籤y,而無監督學習中training資料則沒有標籤y
2. K-means 演算法
以下是該演算法的圖形演示:
注意:其實這裡選取的兩個簇族中心是原始training資料中的任意兩個,而且選擇不同,結果有很大的差異
演算法思想步驟:
(1)隨機從training set中選取K個數據,作為各個簇族中心
(2)根據training set中其他資料距離這K個簇族中心的距離,將其標為相應的簇族set成員
(3)根據各個簇族set資料,求他們的平均值,作為新的簇族中心,來更新各個簇族中心
(4)重複上面步驟(2)和(3),直到兩個簇族集合不再發生變化為止。
演算法描述:
優化目標(cost function)
注意k-means演算法的第一步是隨機選取K個簇族中心的,所以可能會出現區域性最優,並非全域性最優
因此有了下面的演算法步驟:
那k-manes演算法中的大K如何進行選擇呢?
方法一:
方法二: