非負矩陣分解中維數約簡問題的研究

非負矩陣分解中維數約簡問題的研究

《非負矩陣分解中維數約簡問題的研究》是依託南京大學,由趙金熙擔任項目負責人的面上項目。

基本介紹

  • 中文名:非負矩陣分解中維數約簡問題的研究
  • 項目類別:面上項目
  • 項目負責人:趙金熙
  • 依託單位:南京大學
項目摘要,結題摘要,

項目摘要

高維非負數據集的特徵表示是模式識別、機器學習和圖像處理等研究領域的核心課題,非負矩陣分解(NMF)是特徵表示和低秩逼近的有效技術。NMF中的維數約簡因子r 是直接影響特徵表示的重要指標:如r取得過大,就加大計算工作量和存儲空間;r取得太小,就丟失有用的信息而影響NMF的逼近效果。但目前幾乎所有的NMF類算法都需要事先給定r的值,如何自適應得到r的值就成為NMF中具有挑戰性的重要課題。本項目創新性地從討論和研究數據空間形成的特殊錐(cone)的特性入手,依據我們課題組多年的工作積累,在構造基底矩陣W的同時確定r的值,然後通過解非負約束或非負稀疏約束最小二乘模型,通過最最佳化方法求得編碼矩陣H。提出了改進NMF方法(INMF)和半NMF方法(SNMF)。該算法框架無需事先給定r的值,將問題轉化為一個低階凸問題,避免了NP-hard的困難,計算工作量明顯減少,初步模擬結果體現了新算法的有效性

結題摘要

該項目抓住非負矩陣分解中高維數據“降維”這個核心問題進行了深入的研究。在該基金的支持下,我們利用向量系的數值相關性理論等工具,構造數值穩定的計算方法。並將我們的研究成果套用於神經計算方面,得到了一些有意義的結果。主要包括(1)我們提出了名為正交成分分析(orthogonal component analysis,OCA)的快速線性降維算法。OCA主要用於實現兩大目標:低計算複雜度的線性降維,以及自動的目標維數確定。OCA在計算過程中無需求解特徵值問題或矩陣求逆問題,以Gram-Schmite正交化過程為基礎進行特徵空間正交基底的提取,因此保證了較低的計算複雜度。(2)增量式正交分量分析IOCA。形成快速而有效地從高維數據中提取有用信息的方法。作為一種重要的降維技術在機器學習、數據挖掘等領域得到套用。(3)提出一種新型神經網路——感知進化神經網路。目前已有的非監督學習算法中,所有數據輸入都有著固定的數據維度。而在真實的學習環境中,一個新的感知通道的數據時常會產生,這是一種線上自組織增量學習神經網路,相比於傳統無監督機器學習算法,其由多方面優勢。(4)提出了一種基於局部分布學習的自組織增量學習神經網路:局部分布自組織增量學習神經網路(LD-SOINN)。其採用局部的距離矩陣學習和自適應的線上更新策略,從而更好地適應動態變化的數據環境;能夠合併相鄰並具有相似主成分的神經元節點,使得生成的網路結構更加簡潔有效。 在項目資助下,總計發表論文25篇,包括神經網路領域著名國際刊物(影響因子6.108)、(影響因子5.287)、(影響因子3.317)和頂級國際會議IJCAI、知名國際會議IJCNN、ICPR、ICONIP等。發表文章中SCI收錄5篇,EI收錄25篇。申請國家發明專利7項,其中獲授權4項。

相關詞條

熱門詞條

聯絡我們