基於L1-範數的非負張量分解方法研究

基於L1-範數的非負張量分解方法研究

《基於L1-範數的非負張量分解方法研究》是依託中國人民解放軍國防科技大學,由管乃洋擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於L1-範數的非負張量分解方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:管乃洋
  • 依託單位:中國人民解放軍國防科技大學
中文摘要,結題摘要,

中文摘要

多維數據分析是計算機科學、模式識別和信號處理等多學科領域的重要研究手段和熱點研究內容,在遙感影像處理、腦電信號分析、計算機視覺等諸多領域具有重要套用價值。當前,亟待發展有效處理污染數據的多維數據分析相關理論和技術。本項目擬研究基於L1範數的非負張量分解模型、算法及其相關理論問題。首先,研究基於L1範數的非負張量分解模型及其帶稀疏的擴展模型,用於濾除污染多維數據中的噪音。其次,研究基於梯度法的求解算法,利用低秩近似技術降低計算複雜度,用於求解基於L1範數的非負Tucker分解模型。第三,研究基於塊疊代的求解算法,用於求解基於L1範數的非負CP分解模型。最後,研究基於L1範數的非負張量分解模型的局部特徵提取問題,構造基於L1範數的可分非負張量分解模型。本項目將發展多維數據分析理論與技術,為闡明污染非負多維數據恢復機理,揭示非負多維數據的多特徵之間的相互作用規律,有效處理污染數據,提供新途徑。

結題摘要

在真實世界的數據中存在大量的噪音,在一些極端的情況下,數據中甚至存在破損等嚴重污染。機器學習算法必須有效應對這些數據污染的干擾,尤其是在軍事套用領域,情報和感知數據中存在的大量的污染可能徹底破壞機器學習模型。本項目圍繞對抗污染數據干擾的數據分析方法展開研究,提出魯棒的截斷柯西損失函式,利用樣本權重過程比較該損失函式與相關損失函式的魯棒性,發現截斷柯西損失函式在野值點處對模型的貢獻率為零,說明其強大的魯棒性。本項目以截斷柯西損失函式為基礎,構建了截斷柯西非負矩陣分解模型,證明了該模型的泛化界為O(√(ln(n)⁄n)),表明模型對於未知數據具有強大的泛化能力。數值實驗表明,截斷柯西非負矩陣分解模型對較大噪音具有濾除能力,對於野值點污染的數據具有恢復能力。本項目提出基於熵最大化度量理論的非負矩陣分解模型和基於LogDet散度的稀疏非負矩陣分解模型,這些模型皆是魯棒的數據表示方法,可從污染數據中學習有效的特徵。在最佳化算法方面,本項目提出半二次規劃和乘法更新規則框架的高效最佳化算法,從而高效地求解了所提出的魯棒非負矩陣分解模型。本項目關於魯棒機器學習損失函式的研究可推廣到其他機器學習模型的構建中,具有重要科學意義;關於魯棒非負矩陣分解的研究可推廣到魯棒非負張量分解中,為魯棒多維數據分析方法研究奠定基礎,可套用於高光譜數據分析、智慧型商品推薦等系統中,具有重要套用價值。

相關詞條

熱門詞條

聯絡我們