1. 程式人生 > >吳恩達機器學習筆記(week 8)----聚類

吳恩達機器學習筆記(week 8)----聚類

宣告:本文只用於學習交流,若不慎侵權,請及時聯絡我,立即予以刪除

  • 一  聚類 
  1. 監督學習與無監督學習

從上面可以看出,監督學習中training資料帶有標籤y,而無監督學習中training資料則沒有標籤y

2.  K-means 演算法

以下是該演算法的圖形演示:

注意:其實這裡選取的兩個簇族中心是原始training資料中的任意兩個,而且選擇不同,結果有很大的差異 

演算法思想步驟:

(1)隨機從training set中選取K個數據,作為各個簇族中心

(2)根據training set中其他資料距離這K個簇族中心的距離,將其標為相應的簇族set成員

(3)根據各個簇族set資料,求他們的平均值,作為新的簇族中心,來更新各個簇族中心

(4)重複上面步驟(2)和(3),直到兩個簇族集合不再發生變化為止。

演算法描述:                                                

                       

                      

     優化目標(cost function)

                   

注意k-means演算法的第一步是隨機選取K個簇族中心的,所以可能會出現區域性最優,並非全域性最優

                      

因此有了下面的演算法步驟:

                    

那k-manes演算法中的大K如何進行選擇呢?

方法一:

                         

方法二: