k-modes算法是在數據挖掘中對分類屬性型數據的採用的聚類算法。
基本介紹
- 中文名:k-modes聚類算法
- 性質:在數據挖掘中對分類屬性型數據
- 特點:對k-means算法的擴展
- 套用:數據挖掘
k-modes算法是對k-means算法的擴展。k-means算法是在數據挖掘領域中普遍套用的聚類算法,它只能處理數值型數據,而不能處理分類屬性型數據。例如表示人的屬性有:姓名、性別、年齡、家庭住址等屬性。而k-modes算法就能夠處理分類屬性型數據。k-modes算法採用差異度來代替k-means算法中的距離。k-modes算法中差異度越小,則表示距離越小。一個樣本和一個聚類中心的差異度就是它們各個屬性不相同的個數,不相同則記為一,最後計算一的總和。這個和就是某個樣本到某個聚類中心的差異度。該樣本屬於差異度最小的聚類中心。