基於波色量子場論的高維數據非監督學習方法

《基於波色量子場論的高維數據非監督學習方法》是依託北京航空航天大學,由姜鑫擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於波色量子場論的高維數據非監督學習方法
  • 依託單位:北京航空航天大學
  • 項目負責人:姜鑫
  • 項目類別:青年科學基金項目
項目摘要,結題摘要,

項目摘要

高維數據的非監督學習在降維與聚類方面具有重要的基礎研究意義和套用背景。尋求數據集結構特性的準確刻畫原理、構造能夠高度保持特徵結構的低維嵌入映射是當前非監督學習需要面對的一類挑戰問題。本項目計畫進一步發展我們在複雜系統研究中引入的波色量子場論方法和概念,利用量子哈密頓量來描述數據相似性,對數據流形進行重新演繹,建立能較全面反映高維數據集複雜結構的多粒子系統分析框架;並利用量子場論方法刻畫數據集結構的本徵特徵,如流形上的測地距離、多流形重疊區域等;同時尋求該系統的有效求解,將數據集特徵提取轉化為Hilbert空間上多粒子波函式的分析問題,並給出低維嵌入映射的算符形式,提出新的高維數據深層次特徵挖掘與聚類分析算法。申請人在複雜網路的量子波色動力學刻畫方面有著良好的基礎,並擁有一系列原創性研究成果。在此基礎上,本項目將探索高維數據集新的結構描述框架與學習方法,力圖在理論建模與套用方面均取得突破

結題摘要

如何快速有效地挖掘出海量高維數據的內在本徵結構和規律性、提取有價值的信息是當前數據統計分析等相關領域研究的核心任務之一。 本項目研究對象是高維數據非監督學習方法,其特色是直接從數據集原始的內在聯繫與結構出發,發現其內在規律。 研究內容包括發展體現高維數據全局非線性與多流形結構特徵的網路嵌入方法,建立數據集結構的(量子)系統描述框架,並提出數據特徵屬性的動力學函式刻畫新方法。項目在執行過程中主要研究了兩方面的問題,一是高維數據的空間隨機網路嵌入與最佳化問題,研究了大數據集中非均勻數據相關性分布的統計規律以及流形網路構建和聚類分析。二是對數據集結構的物理系統描述與分析做了初步探索,研究了基於數據集結構的動力學行為(類量子行為與非線性動力學行為)。主要研究成果有:1、給出了高維數據的網路化方法並建立了數據模組性分析的一般性原理。2、給出了數據網路模組性差異的刻畫機制及基於反應擴散過程的統計度量,並得到了高維數據全局非線性關係刻畫,如利用擴散過程(量子隨機遊走)的平均首達時分布來刻畫數據集中模組的效能指標,提出了Global module first passage time(GMMFPT)指標。3、利用多重網路模型研究了相關性數據集的層次結構。 通過對數據集中各數據點的相關性統計分析建立了兩個或多個相關數據集的層次結構分析方法。相關成果發表在Physical Review E, EPL (Europhysics Letters),Journal of Statistical Mechanics: Theory and Experiment等國際知名期刊。項目當前共發表SCI論文11篇,EI論文2篇,目前還有四篇文章在審。項目負責人2013年獲教育部自然科學一等獎(排名第四),2014年參加 National Conference on Quantification of Uncertainty in Engineering, Science & Technology (QUEST2014)並被邀請做分會場報告。在國際學術交流方面,項目負責人2013年獲德國DAAD青年科學家獎資助並赴海德堡大學國際交叉學科交流中心訪問,2015年獲國家留學基金委資助赴美國西北大學套用數學系訪問。

相關詞條

熱門詞條

聯絡我們