鄰里成分分析

定義

鄰里成分分析是一種距離度量學習方法，其目的在於通過在訓練集上學習得到一個線性空間轉移矩陣，在新的轉換空間中最大化平均留一（LOO）分類效果。該算法的關鍵是與空間轉換矩陣相關的的一個正定矩陣A，該矩陣A可以通過定義A的一個可微的目標函式並利用疊代法（如共軛梯度法、共軛梯度下降法等）求解得到。該算法的好處之一是類別數K可以用一個函式f（確定標量常數）來定義。因此該算法可以用來解決模型選擇的問題。

解釋說明

為了定義轉換矩陣A，我們首先定義一個在新的轉換矩陣中表示分類準確率的目標函式，並且嘗試確定A使得這個目標函式最大化。

留一分類

對一個單一的數據點進行類別預測時，我們需要考慮有一種給定的距離度量確定的K個最近鄰居，根據k個近鄰的類別標籤投票得到該樣本的類別。這就是留一（Loo）分類算法。但是對所有數據集進行一個線性空間變換之後，新空間中的同一樣本的最近鄰居集可能跟原空間的最近鄰居集有很大差別。特別的，為了平滑A中元素的變化，我們可以使該樣本的最近鄰居集離散化，也就是說任意一個基於一個點的最近鄰居集的目標函式f都是離散的，因此也是不連續的。