k均值聚類算法(k-means clustering algorithm)是一種疊代求解的聚類分析算法,其步驟是隨機選取K個對象作為初始的聚類中心,然後計算每個對象與各個種子聚類中心之間的距離,把每個對象分配給距離它最近的聚類中心。聚類中心以及分配給它們的對象就代表一個聚類。每分配一個樣本,聚類的聚類中心會根據聚類中現有的對象被重新計算。這個過程將不斷重複直到滿足某個終止條件。終止條件可以是沒有(或最小數目)對象被重新分配給不同的聚類,沒有(或最小數目)聚類中心再發生變化,誤差平方和局部最小。
基本介紹
- 中文名:K均值聚類算法
- 外文名:k-means clustering algorithm
- 類型:聚類算法
- 提出者:James MacQueen
- 提出時間:1967年
- 套用:數據分析,信號處理,機器學習