面向高維數據挖掘的非負矩陣分解關鍵問題研究

面向高維數據挖掘的非負矩陣分解關鍵問題研究

《面向高維數據挖掘的非負矩陣分解關鍵問題研究》是依託北京交通大學,由景麗萍擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向高維數據挖掘的非負矩陣分解關鍵問題研究
  • 項目類別:面上項目
  • 項目負責人:景麗萍
  • 依託單位:北京交通大學
項目摘要,結題摘要,

項目摘要

隨著信息化和網際網路的發展,高維數據在各領域不斷湧現,如何挖掘和利用這些數據成為新世紀信息技術面臨的重大挑戰。高維數據挖掘的一個核心任務是找到一種具備清晰潛在結構的低維模型來表示原始高維數據。非負矩陣分解(NMF)所展現的局部構成整體思想能夠為該任務的完成提供有效的解決思路。然而現有的NMF模型和求解方法已無法滿足海量高維數據的高效挖掘需求。因此,本項目將結合高維數據特點和NMF理論方法,重點開展如下工作:1、研究高維數據低秩性和隱變數圖模型學習理論,設計無參NMF初始化方法;2、研究高維數據子空間存在性和交叉性,設計有效子空間識別NMF方法;3、研究數據監督信息特點,設計融合多類型監督信息的半監督NMF方法;4、研究多模態數據的形成機理和協同機制,設計協同NMF學習方法;5、研究最佳化理論和並行化思想,設計高效快速的NMF模型求解方法,最終為數據挖掘系統提供基於NMF的高效學習方法接口。

結題摘要

隨著信息化和網際網路的發展,高維數據在各領域不斷湧現,如何挖掘和利用這些數據成為 新世紀信息技術面臨的重大挑戰。高維數據挖掘的一個核心任務是找到一種具備清晰潛在 結構的低維模型來表示原始高維數據。非負矩陣分解(NMF)所展現的局部構成整體思 想能夠為該任務的完成提供有效的解決思路。然而現有的NMF模型和求解方法已無法滿足 海量高維數據的高效挖掘需求。本項目圍繞上述問題,從理論研究和技術創新上取得以下成果:揭示實際套用中高維數據的特點(稀疏性、子空間存在性等),研究矩陣不變子空間理論、隱變數圖模型學習理論、稀疏編碼和資訊理論,提出自動識別子空間的 NMF 模型和 NMF 初始化設定方法;探討套用領域監督信息數學建模的方法,分析監督信息對數據矩陣和 NMF 分解因子的指導作用,提出新的統一半監督學習框架和半監督 NMF 學習模 型;分析多模態高維數據多態信息的互補性和相容性,提出協同 NMF 學習模型,強調融合機制與學習算法的效用相互結合,突破制約多模態信息處理協同性和高效性的技術瓶頸;研究最佳化理論和並行化思想,提出高效快速的 NMF 求解最佳化算法。在項目組成員的共同努力下,相繼發表期刊論文30篇,會議論文10篇,接受論文4篇。包括SCI檢索A1區期刊論文3篇,SCI檢索A2區期刊論文6篇,SCI檢索A3區期刊論文6篇,IEEE Trans.系列期刊論文7篇;CCF A類期刊論文4篇,CCF A類會議論文3篇,其中一篇獲得優秀學生論文;國內EI檢索學術期刊論文5篇。國核心心期刊論文10篇。培養16名研究生,已畢業4名博士生、6名碩士生。

相關詞條

熱門詞條

聯絡我們