《多概念格集成與知識獲取方法研究》是依託山西大學,由王俊紅擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:多概念格集成與知識獲取方法研究
- 項目類別:青年科學基金項目
- 項目負責人:王俊紅
- 依託單位:山西大學
項目摘要,結題摘要,
項目摘要
概念格是數據分析的一種有效方法,已被成功套用到知識發現等領域,然而面對日益複雜的數據分析需求,傳統的單一概念格具有其局限性,研究多概念格集成具有重要的理論意義和套用價值。本項目擬針對單一信息系統、多源信息系統、分散式信息系統,研究多概念格集成的分析描述框架、建模方法以及知識獲取,具體內容包括:(1)構建並置和疊置形式背景上的連線運算元,建立多概念格集成的分析描述框架;(2)給出多概念格約簡的判定定理,設計多概念格的概念選擇和格選擇方法;(3)給出基於多概念格集成的規則提取算法和規則冗餘檢測方法,提出基於多Iceberg概念格的頻繁項集和關聯規則挖掘算法,給出多優勢概念格分級規則獲取算法。本課題的研究將建立多概念格集成及知識獲取的理論和方法體系,為運用智慧型計算解決實際問題提供新的理論基礎與技術支撐。
結題摘要
概念格是進行數據分析的一種有效方法,已被成功套用到知識發現等領域,然而面對日益複雜的數據分析需求,傳統的單一概念格具有其局限性,研究多概念格集成具有重要的理論意義和套用價值。項目組按照項目計畫書的要求開展了研究工作,並取得了一系列研究成果。(1)給出了粒度概念格模型及其構造方法,證明了粒度概念格和原概念格之間的關係。給出了漸進式偽規則獲取方法,提出了兩個偽規則集進行合併的方法。(2)提出了一種無冗餘決策規則的概念,並且給出了粒度規則和決策規則的獲取方法。(3)提出了一種決策形式背景中對象壓縮的理論框架和方法,保證了在不丟失決策規則信息前提下的對象約簡。(4)提出了一種樣本約簡和維度約簡的加速策略,該方法能夠加速模糊粗糙特徵選擇的過程。構造了Shannon熵和互補熵意義下的區分矩陣,揭示了不同意義下屬性約簡的相互關係。(5)提出了一種結合無監督學習的數據流分類算法,通過比較分類和聚類結果的準確率,來判斷是否發生了概念漂移;提出了一種基於Kappa係數的數據流分類算法。