模糊目標聚類

概念

模糊目標聚類(Fuzzy target clustering)是一種聚類方法。它是利用建立在軟劃分空間上的目標函式進行聚類的一種數學方法。設X={x₁，x₂，…，x_n}是有限集，x_i=(x_i1，x_i2，…，x_ip)，對任何2≤c≤n，以及X的c個子集{A_i： i=1，2，…，c}滿足：

則{A_i}成為X的一個硬劃分。考慮硬劃分的特徵函式表達，則：

稱為硬劃分空間；而：

稱為軟劃分空間。

由x_i的特徵數據值，便可根據密度、最小平方等，建立軟(硬)劃分空間上的泛函(目標函式)，而這些泛函的極小點即為在該目標下的最佳軟(硬)分類。常用的泛函有：

1.密度泛函J_R： M_fc→R；

是固定數，σ是實常數，d_jk=d(x_j，x_k)是R中的度量。

2.最小平方泛函J_m： M_fc×R→R；

是一軟劃分，V∈R是聚類中心。

聚類分析

聚類分析是多維數據的統計分類方法。它與判別分析的最大差別是事先並不知道所需聚類的各個樣本各屬何類，甚至分類數也可能未知。因此聚類分析也稱為“無師可學”的分類。聚類分析中，首先需要解決分類依據，即什麼樣的對象比較親近，從而應該聚成一類；然後是研究把對象分配到各類中的方法。在實踐中，由於聚類目的要求不同，分類的準則和方法也可以有差別。設有N個m維樣本的數據矩陣

例如，是N個學生的m門功課的成績。這時可提出如下的分類要求：

1.N個學生如何按成績分類。

2.學生的哪些門功課的成績比較相似。

前者的聚類對象為樣本(矩陣中的行)；後者是變數(列)。為區分二者，依次稱為Q型聚類和R型聚類。然而，脫離套用背景，從純數學考慮，一個矩陣的行、列可由套用者自行定義。所以兩型的區分就不是本質的了。為方便，把要聚類的樣本或變數統稱為聚類對象。

分類的依據是分類對象之間的親近度。親近度可以用距離度量，這時，兩個分類對象被看成是兩個點，距離最近的兩個點最親近。親近度也可以用相似性(或相關性)來度量，這時，兩個分類對象被看做是兩個向量，其夾角最小(或相關係數最大)的兩個向量最親近。

最常用的聚類方法是譜系聚類法。開始時，每個對象各成一類，然後把最親近的兩個對象合併為一類.以後的每一步都是從現存的類中，合併最親近的兩類為一類，即每步減少一個類，直至得到所需的類數(或最終只有一個大類)為止。合併過程，包括合併時的親近程度可繪製成一個譜系聚類圖.需要注意的是，一旦有一類內含有多於一個對象，類與類之間的親近度也有多種意義，從而對應著不同的聚類結果。譜系聚類方法也可以是反向進行的。即先把所有對象都放在一個大類中，然後按一定的準則逐步分割，每步總是把現存類中的某一個分割成兩個，直至得到所需類數或每個類都只含一個對象為止。此外，還有動態聚類法和有序樣本聚類法等，它們分別適用於分類對象很多和樣本的順序不能變更的聚類場合。

模糊目標聚類

基本介紹

概念

聚類分析

相關詞條

熱門詞條