《面向商務智慧型的思維主題發現》是依託北京科技大學,由高學東擔任項目負責人的面上項目。
基本介紹
- 中文名:面向商務智慧型的思維主題發現
- 依託單位:北京科技大學
- 項目負責人:高學東
- 項目類別:面上項目
項目摘要,結題摘要,
項目摘要
商務智慧型數據挖掘套用過程中業務理解和數據理解階段任務(即確定數據挖掘分析主題及任務)缺乏工程化解決方法,阻礙了數據挖掘的工程化套用進程,影響商務智慧型工程化實踐。.本項目針對數據挖掘工程化套用過程中上述障礙問題,研究面向業務決策人員的思維建模及分析主題發現技術。旨在模擬決策人員思維模式,給出主動確定數據挖掘主題、任務及相關數據組織策略的結構化方法。研究內容包括:.(1)思維單元的結構化建模技術,形式化表示思維單元及其之間的聯繫。.(2)思維分析主題發現方法,包括思維序列抽取、思維序列聚類和分析主題特徵序列提取等子問題。.(3)思維分析主題邏輯結構識別方法。.(4)思維分析主題漂移檢測及更新方法,檢測思維分析主題漂移現象,並對其進行增量式更新。
結題摘要
針對商務智慧型數據挖掘套用過程中業務理解和數據理解階段的任務,即數據挖掘分析主題及數據挖掘任務的確定問題,研究、建立工程化解決方法。在項目計畫中,明確的研究內容有:(1)思維單元及其結構化建模技術,形式化表示思維單元及其之間的聯繫。(2)思維分析主題發現方法,包括思維序列抽取、思維序列聚類和分析主題特徵序列提取等子問題。(3)數據挖掘任務確定方法。 本項目研究,到目前為止,取得以下研究進展: (1)提出了思維序列構建方法。原始數據由大量散亂殘缺的思維碎片組成,不能直接支持思維主題發現和思維模式發現的計算。思維流程發現必須首先將原始數據(概念對)轉化為層次分明且信息完整的中間數據。思維序列構建是思維流程發現的第一步。思維序列構建將這些雜亂無序的思維碎片連結成為思維序列,使思維信息初步有序,為思維主題發現和思維模式發現奠定了基礎。 (2)建立了思維(分析)主題發現方法。基於分析問題聚類的思維主題發現方法分為思維序列聚類和思維主題構建兩部分。 思維序列聚類不斷將思維序列與現有的分析問題的特徵比較,將思維序列融入與其特徵最為相近的分析問題,並更新融合之後的分析問題的分析特徵。思維序列聚類將思維序列集聚集成分析問題集。 根據分析問題特徵向量計算思維主題相似度,利用層次聚類法聚集思維主題。思維主題聚集完成之後,思維主題構建算法對思維主題進行概念層次結構分析和問題結構分析,給出思維主題的基本結構。 (3)提出了思維主題的更新算法。思維主題的更新算法在現有的思維主題的基礎上採用增量更新的方法,通過更新思維序列集、更新分析問題和重新聚合思維主題三步,完成思維主題的更新。 (4)提出了數據挖掘任務發現方法。提出並論證了數據挖掘任務的判定定理,給出了基於概念網路的數據挖掘任務發現算法。特別說明:該部分研究成果已形成論文,將在2017年7月在日本舉行的物流與信息服務科學國際學術會議上發表。