複雜多視圖高維數據子空間聚類方法研究

複雜多視圖高維數據子空間聚類方法研究

《複雜多視圖高維數據子空間聚類方法研究》是依託大連理工大學,由於紅擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:複雜多視圖高維數據子空間聚類方法研究
  • 依託單位:大連理工大學
  • 項目類別:青年科學基金項目
  • 項目負責人:於紅
項目摘要,結題摘要,

項目摘要

多視圖子空間聚類是多視圖高維數據聚類的重要方法。現有的方法沒有深入分析不同視圖下數據實例可聚性的差異,並且沒有考慮數據視圖間是部分映射或無映射的以及數據規模龐大或增量變化的複雜多視圖高維數據。.針對以上問題,本項目擬深入研究複雜多視圖高維數據的子空間聚類方法: (1)根據不同視圖下數據實例的可聚性差異,研究自適應的視圖權重分配算法,設計視圖權重自適應的多視圖子空間聚類方法;(2)研究視圖間無映射情況下視圖間約束的損失函式表示,設計基於視圖間約束的多視圖子空間聚類方法;(3)針對視圖間部分映射的多視圖高維數據,設計兩階段式多視圖子空間聚類方法;(4)研究多視圖下自適應的抽樣方法,設計基於自適應抽樣策略的多視圖子空間增量聚類方法,解決大規模或增量變化的多視圖高維數據的聚類問題。.本課題的研究可以提高對多視圖高維數據的處理能力,為數據挖掘、模式識別等套用提供有效方法。

結題摘要

多視圖子空間聚類是多視圖高維數據聚類的重要方法。本項目深入研究複雜多視圖高維數據的聚類方法。(1)提出了一種加權的多視圖k均值聚類策略,即在k均值聚類方法中引入了L2,1範數,從而減弱異常數據點對k-均值算法帶來的負面影響,得到更加魯棒的效果。(2)針對多視圖加權策略不能同時有效利用多視圖聚類特點和相應單視圖聚類特點的問題,提出一種基於譜擾動的加權多視圖譜聚類方法。該方法在加權多視圖譜聚類中充分利用譜聚類的譜擾動特性,使用最大規範角來度量不同譜聚類效果之間的差異,最終將權重求解問題轉化為標準的二次規劃問題。(3)為了深入挖掘隱藏在數據中的內在特徵,提出了一種基於深度矩陣分解的自加權多視圖聚類(SMDMF)。通過執行深度分解結構,消除干擾,揭示多視圖數據的語義信息。(4)本項目提出了共正則化多視圖子空間聚類方法,將譜聚類加入到多視圖子空間聚類的目標方程中進行聯合最佳化。使用指標矩陣來確保同時對每個視圖的子空間表示執行聚類,並增加了一個共同正則化的約束,以保證指標矩陣的一致性。(5)本項目在擾動風險最小邊界和不完備多視圖聚類之間建立橋樑,提出一種擾動誘導的不完備多視圖聚類方法。將數據特徵缺失轉換為數據點間相似度缺失,並提出一種有效的相似度填充方法,減小特徵缺失帶來的風險;利用圖譜理論,指出譜擾動邊界最小化等同於不同視圖間融合結果最大化,從而給出融合機制的一個準則。(6)本項目將自步學習策略與多視圖K-means、多視圖譜聚類相融合,旨在運用自步學習策略度量各個視圖的重要性,從而為多個視圖賦予動態權重。使得提出的算法能夠更充分地利用多視圖所包含的信息。最終達到提升聚類效果的目的。(7)將多視圖聚類套用於網路商品的特徵信息相似性與語義關聯性的挖掘中,從而改進協同過濾算法以解決該算法中存在的數據稀疏性問題。以上方法在人工和真實多視圖數據集上的實驗結果明顯優於現有基線算法。

相關詞條

熱門詞條

聯絡我們