混合數據多粒度粗糙計算模型與算法研究

混合數據多粒度粗糙計算模型與算法研究

《混合數據多粒度粗糙計算模型與算法研究》是依託山西大學,由魏巍擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:混合數據多粒度粗糙計算模型與算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:魏巍
  • 依託單位:山西大學
項目摘要,結題摘要,

項目摘要

現實生活中廣泛存在著名義型、數值型、有序型和區間型等多種類型並存的混合數據,這種結構複雜、形式異構的數據模式給傳統的數據分析方法帶來了挑戰。本項目擬借鑑人類多粒度認知和逼近推理的問題求解方法,開展面向混合數據的多粒度粗糙分析模型與算法研究,主要內容有:(1)研究不同類型屬性下目標概念的粗糙近似,探索不同類型粗糙近似的融合方法,建立面向混合數據多粒度粗糙集模型;(2)給出能夠有效刻畫混合數據中不同類型屬性下目標決策邊界域的大小和結構的粗糙性度量;(3)給出基於混合數據粗糙性度量的屬性子集評價方法,建立從對象和屬性兩個方向同時縮小數據規模的啟發式屬性約簡加速策略;(4)給出基於粗糙性度量的決策樹生成算法,建立面向混合數據的隨機森林分類方法。本項目研究成果將為面向混合數據的知識發現提供新途徑,對數據挖掘和機器學習等領域的研究具有重要的理論意義和套用價值。

結題摘要

混合數據廣泛地存在於自然科學、社會經濟等諸多領域,基於粗糙集理論的數據粒化和粗糙近似的思想,特別是多粒度融合思想,可以有效地解決多種不同類型屬性共存的混合數據知識發現問題。因此,本項目選擇以粗糙集理論與方法為主要工具,並結合機器學習的相關技術,面向混合數據開展相關模型與算法的創新性研究,主要獲得了以下研究成果:(1)建立了面向混合數據多粒度粗糙集模型;(2)分析了粗糙集理論中常見不確定性度之間的關係;(3)給出了基於數據對象分塊融合的高效混合數據約簡算法和逐步去除無關對象和屬性的屬性約簡加速算法;(4)提出了基於粗糙隨機子空間的混合數據隨機森林分類方法。這些研究成果將為面向混合數據的知識發現提供新途徑,對促進數據挖掘、粒計算等領域的相關研究具有重要的理論意義和套用價值。

相關詞條

熱門詞條

聯絡我們