聚類結構保持的降維技術及其拓展研究

聚類結構保持的降維技術及其拓展研究

《聚類結構保持的降維技術及其拓展研究》是依託南京師範大學,由蔡維玲擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:聚類結構保持的降維技術及其拓展研究
  • 項目類別:青年科學基金項目
  • 項目負責人:蔡維玲
  • 依託單位:南京師範大學
項目摘要,結題摘要,

項目摘要

高維數據的湧現是機器學習面臨的極大挑戰,降維技術已成為處理高維數據,克服維數災難的重要途徑。現有兩類降維方法,即關注樣本總體分布特點的全局降維方法和關注每個樣本鄰域結構的局部降維方法,都忽略了高維數據中所蘊含的聚類結構分布,導致在降維過程中聚類趨勢減弱、甚至消失。本項目從聚類結構保持的角度出發,提出一種新的降維思路,並對此進行一系列的拓展研究。主要研究內容包括:(1)構建聚類結構保持的降維方法總框架,並分別在無監督、半監督和全監督情形下,設計具體的降維算法;(2)在半監督和全監督情形下,分別利用運算元運算和貝葉斯理論構造低維空間中聚類和類別間的關係矩陣,並從理論上分析矩陣的涵義;(3)利用該矩陣設計合理的分類機制。本項目旨在為高維數據提供一種新的降維技術,並挖掘出降維後數據中所隱含的知識,為人臉識別、手寫體識別、文本分類等套用領域提供一種全新的數據分析手段。

結題摘要

高維數據的湧現是機器學習面臨的極大挑戰,降維技術已成為處理高維數據,克服維數災難的重要途徑。本項目從聚類結構保持的角度出發,提出一種新的降維思路,並對此進行一系列的拓展研究。主要研究成果包括:(1)構建聚類結構保持的降維方法總框架,設計具體的降維算法;(2)分別利用運算元運算和貝葉斯理論構造低維空間中聚類和類別間的關係矩陣,並從理論上分析矩陣的涵義;(3)設計出能同時完成聚類學習和分類學習的多目標學習模型,並採用多目標最佳化技術來求解;(4)在上述模型中進一步引入度量學習的思想,設計出可以完成聚類學習、分類學習、度量學習的算法。本項目旨在為高維數據提供一種新的降維技術,並挖掘出降維後數據中所隱含的知識,為人臉識別、手寫體識別、文本分類等套用領域提供一種全新的數據分析手段。

相關詞條

熱門詞條

聯絡我們