等距特徵映射

等距特徵映射(Laplacian Eigenmaps)使用頻譜技術來執行降維。該技術依賴於基本假設,即數據位於高維空間中的低維流形中。該算法不能嵌入樣本點,但是存在基於再生核Hilbert空間正則化的技術來增加這種能力。這些技術也可以套用於其他非線性降維算法。

基本介紹

  • 中文名:等距特徵映射
  • 外文名:Laplacian Eigenmaps
介紹,套用,

介紹

主成分分析等傳統技術不考慮數據的內在幾何。拉普拉斯運算元特徵映射根據數據集的鄰域信息構建圖形。每個數據點用作圖上的節點,並且節點之間的連線由相鄰點的接近度控制(使用例如k-最近鄰居算法)。由此生成的圖可以被認為是高維空間中的低維流形的離散近似。基於該圖最小化成本函式確保在歧管上彼此接近的點在低維空間中彼此靠近地映射,從而保持局部距離。拉普拉斯 - 貝爾特拉米運算元在流形上的本徵函式用作嵌入維數,因為在溫和條件下,該運算元具有可計數的譜,該譜是流形上的平方可積函式的基礎(與單位圓流形上的傅立葉級數相比)。試圖將拉普拉斯特徵映射置於堅實的理論基礎上已經取得了一些成功,因為在某些非限制性假設下,隨著點數變為無窮大,圖拉普拉斯矩陣已經顯示收斂到拉普拉斯 - 貝爾特拉米運算元。Laplacian Eigenmaps的Matlab代碼可以在算法中找到,Belkin的博士論文可以在俄亥俄州立大學找到。

套用

在分類套用中,低維流形可用於建模數據類,這些數據類可以從觀察到的實例組中定義。每個觀察到的實例可以用兩個獨立因素來描述,稱為“內容”和“風格”,其中“內容”是與類本質相關的不變因子,“風格”表示實例之間該類的變化。不幸的是,當訓練數據包括在風格方面變化很大的實例時,拉普拉斯特徵圖可能無法產生感興趣類的連貫表示。在由多元序列表示的類的情況下,已經提出結構拉普拉斯特徵映射來通過在拉普拉斯運算元特徵映射鄰域信息圖中添加附加約束來更好地反映該類的內在結構來克服該問題。更具體地,該圖用於編碼多變數序列的順序結構,並且如果其包含重複,則用於最小化風格變化,不同序列的數據點之間或甚至在序列內的接近度。使用動態時間扭曲,通過找到表現出高相似性的多變數序列的部分之間和之內的對應關係來檢測接近度。在基於視覺的活動識別,面向對象分類和人體3D姿勢恢復套用上進行的實驗已經證明了在處理多變數序列數據時結構拉普拉斯特徵圖的附加值。結構拉普拉斯特徵圖的擴展,廣義拉普拉斯特徵圖導致了流形的產生,其中一個維度特別代表風格的變化。事實證明,這在跟蹤人體關節體和輪廓提取等套用中尤為重要。

相關詞條

熱門詞條

聯絡我們