高維數據的幾何結構分析

《高維數據的幾何結構分析》是依託北京大學,由林宙辰擔任負責人的面上項目。

基本介紹

  • 中文名:高維數據的幾何結構分析
  • 項目負責人:林宙辰
  • 項目類別:面上項目
  • 依託單位:北京大學
項目摘要,結題摘要,

項目摘要

當今是高維和海量數據的時代,如何快速有效地處理高維數據是一個巨大挑戰。高維數據的分布非常複雜,幾何結構分析是分析高維數據的重要方法,因為數據的幾何結構蘊涵了數據的聚類和分類信息。本項目針對現有方法的一些不足之處,利用稀疏表示、半黎曼幾何、核方法等數學工具,研究魯棒的線性或非線性多子流形分解的數學模型,並基於半黎曼幾何推廣流形學習的理論與方法,以解決感知距離(流形上距離)小於歐氏距離的問題。為刻畫數據分布的稀疏性,本項目進一步研究保持範數可分解性和促結構稀疏性的運算,以及高階稀疏性的可計算的度量。這是目前稀疏表示理論的關鍵問題。本項目還研究相應的快速算法,尤其是低複雜度的隨機算法,及其GPU實現,以解決處理高維數據時計算上的困難。

結題摘要

當今是大數據時代,數據往往具有高維特性,因此如何快速有效地處理高維數據是一個巨大挑戰。高維數據的分布非常複雜,幾何結構分析是分析高維數據的重要方法,因為數據的幾何結構蘊涵了數據的聚類和分類信息。 本項目利用稀疏表示、低秩表示等數學工具,研究魯棒的線性或非線性多子流形分解的數學模型,以及相應的快速算法,尤其是低複雜度的一階和隨機算法,以解決處理高維數據時計算上的困難。 取得的重要結果有:1、理論方面:在子空間聚類模型上取得了系統性的研究成果,並推廣到張量聚類模型和非線性的子流形聚類模型,在多個識別與聚類問題上測試錯誤率可下降一半左右;2、算法方面:提出了線性化交錯方向法、廣義疊代重加權算法等一系列一階或隨機最佳化算法,在多個最佳化問題的求解上均取得了3倍以上的加速;3、套用方面:提出了新的彩色濾波陣列設計理論和更強有力的圖像分類方法,奪得2015年ImageNet場景分類競賽冠軍。在重要期刊發表論文33篇(CCF A類15篇,其中IEEE TPAMI 4篇、IEEE TIP 9篇),重要會議發表論文30篇(CCF A類20篇,其中ICCV 3篇、CVPR 9篇、AAAI 5篇),申請或授權國內專利3項。由於本人的出色研究,本人應邀擔任CCF A類會議CVPR 2014/2016、ICCV 2015、NIPS 2015的領域主席和AAAI 2016/2017、IJCAI 2016的高級程式委員,CCF A類雜誌IEEE TPAMI和IJCV的編委。2016年獲得國家自然科學傑出青年基金資助並當選IAPR Fellow。

相關詞條

熱門詞條

聯絡我們