面向大規模複雜數據的主曲線多粒度建模與分析

面向大規模複雜數據的主曲線多粒度建模與分析

《面向大規模複雜數據的主曲線多粒度建模與分析》是依託同濟大學,由張紅雲擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向大規模複雜數據的主曲線多粒度建模與分析
  • 項目類別:面上項目
  • 項目負責人:張紅雲
  • 依託單位:同濟大學
中文摘要,結題摘要,

中文摘要

主曲線學習是維數約簡、數據可視化、模式識別等領域對數據進行分析的重要工具之一。目前大量主曲線算法被相繼提出,但現有算法在處理大規模複雜數據時存在算法耗時過大、準確率低、適應性差等缺點。本項目擬借鑑人處理複雜問題的多粒度認知機理和深度學習策略,依據智慧型最佳化方法,通過對大規模複雜數據進行主曲線多粒度建模與分析來解決該問題。研究內容為:(1)對規模龐大、結構複雜的數據進行粒化拆分,形成局部數據,進行局部主曲線學習建模和特徵提取;(2)基於粒計算思想,進行局部模型到全局模型的主曲線多粒度建模;(3)借鑑深度學習的逐層特徵提取及訓練策略,設計模型間特徵信息獲取和訓練方法; (4)給出模型的粒度選擇算法。(5)對該模型進行分析與驗證。其關鍵科學問題是模型間特徵信息的多粒度融合技術。本項目的研究將不僅為大規模複雜數據主曲線學習提供一種新的解決方案,而且對推動非線性智慧型信息處理的發展具有重要的理論意義。

結題摘要

主曲線學習是維數約簡、數據可視化、模式識別等領域對數據進行分析的重要工具之一。針對現有算法在處理大規模複雜數據時存在算法耗時過大、準確率低、適應性差等缺點。課題組借鑑人處理複雜問題的多粒度認知機理和深度學習策略,依據智慧型最佳化方法,研究了通過對大規模複雜數據進行主曲線多粒度建模與分析來解決主曲線提取問題,並將其套用於圖像檢索、行人再識別和書法字動態重現等領域。取得的主要研究成果為:(1)提出基於拐點估計的改進譜聚類算法來解決規模龐大、結構複雜的數據的粒化問題;(2)提出基於MapReduce的分散式軟K段主曲線算法來解決海量數據主曲線提取問題,先提出動態覆蓋信息系統的知識約簡方法消除數據冗餘,然後採用我們提出的粒化算法對數據進行粒化,形成局部數據,基於MapReduce並行局部主曲線提取,最後藉助哈密頓路徑和貪婪算法的思想,從局部到全局形成整個數據的主曲線;(3)研究複雜數據主曲線學習和特徵提取問題,提出用平衡K均值聚類算法將數據空間粒化成多個局部數據,採用互信息方法度量局部數據間的關聯性,進行局部特徵提取,提出了基於覆蓋信息系統的增量式屬性約簡算法來進行特徵選取;(4)研究基於局部主曲線的逐層多粒度主曲線建模,利用主曲線的方向梯度,形狀特徵和曲線的幾何特徵等信息,結合深度學習思想,進行逐層特徵提取,基於覆蓋度和特異性的特徵信息進行多粒度特徵融合,依據粒計算的多粒度多層次思想進行從局部到全局的逐層主曲線建模;(5)將模型套用於圖像檢索、書法字動態重現等複雜數據分析處理,實現對模型進行分析驗證。本項目的研究不僅為大規模複雜數據主曲線學習提供一種新的解決方案,而且對推動非線性智慧型信息處理的發展具有重要的理論意義。

相關詞條

熱門詞條

聯絡我們