學習向量量化

學習向量量化

學習向量量化(Learning Vector Quantization,簡稱LVQ)屬於原型聚類，即試圖找到一組原型向量來聚類，每個原型向量代表一個簇，將空間劃分為若干個簇，從而對於任意的樣本，可以將它劃入到它距離最近的簇中，不同的是LVQ假設數據樣本帶有類別標記，因此可以利用這些類別標記來輔助聚類。

基本介紹

中文名：學習向量量化
外文名：Learning vector quantization
縮寫：LVQ
本質：屬於原型聚類
類別：監督學習統計學分類算法

簡介,算法介紹,

簡介

在計算機科學中，學習向量量化 (LVQ)是一種基於原型的監督學習統計學分類算法。 LVQ是向量量化的監督版本。

LVQ可以被理解為人工神經網路的一個特例，更確切地說，它套用了一種勝者通吃的Hebbian學習方法。它是自組織圖（SOM）的前體，與神經氣體和k近鄰算法（k-NN）有關。 LVQ由Teuvo Kohonen發明。

LVQ系統由原型

表示，其中在觀察數據的特徵空間中定義。在獲勝者通吃訓練算法中，對於每個數據點，根據給定距離度量確定最接近輸入的原型。然後調整這個所謂的獲勝者原型的位置，即如果正確地對數據點進行分類則將獲勝者移近或如果它不正確地對數據點進行分類則將其移開。

LVQ的一個優點是它可以為相應套用領域的專家創建易於解釋的原型。LVQ系統可以以自然的方式套用於多類分類問題。它用於各種實際套用中。

LVQ的一個關鍵問題是為訓練和分類選擇適當的距離或相似性度量。最近，已經開發了在訓練系統的過程中調整參數化距離測量的技術。

LVQ可以成為分類文本文檔的有力工具。

算法介紹

該算法包括3個基本步驟。算法的輸入是：

系統將有多少神經元

（在最簡單的情況下，它等於類的數量）

每個神經元

的重量

為

每個神經元的相應標籤

神經元學習的速率

輸入列表

包含已經知道標籤的所有向量（訓練集）。

算法的流程是：

對於

中的下一個輸入

，找到最近的神經元

，

即

，其中

是使用的指標（歐幾里德等）。

更新

。更好的解釋是將

更接近輸入

，如果

和

，如果不滿足此條件，則它們屬於同一個標籤並讓它們分開。

雖然在

中有剩餘的向量，但是轉到第1步，否則終止。

注意：

和

是特徵空間中的向量。

相關詞條

熱門詞條

聯絡我們