面向大數據的粒計算理論與方法

面向大數據的粒計算理論與方法

《面向大數據的粒計算理論與方法》是依託山西大學,由梁吉業擔任項目負責人的聯合基金項目。

基本介紹

  • 中文名:面向大數據的粒計算理論與方法
  • 項目類別:聯合基金項目
  • 項目負責人:梁吉業
  • 依託單位:山西大學
項目摘要,結題摘要,

項目摘要

針對傳統數據分析技術無法滿足大數據可計算性、有效性以及時效性等要求的現狀,探索大數據分析的粒計算新理論與新方法具有重要的理論意義與套用價值。本項目針對大數據的規模性、多模態性以及增長性三個特點,從數據粒化、多粒度模式發現與融合、多粒度/跨粒度推理與套用示範等方面著手開展深入系統的研究。具體內容包括:(1)探求大數據的多視角粒化機理,給出數據粒化的基本策略與算法;(2)研究多模態信息的知識表示、多粒度建模與決策機制;(3)運用不確定決策流圖構建多粒度/跨粒度推理機制,並提出相應的推理算法;(4)以社會媒體數據、天文數據為載體,構建一套公共安全監控與預警系統,實現對公共安全事件發現、跟蹤、分析與預警等,構建基於概念本體粒化和不確定流圖的太陽活動預報模型。並搭建面向公共安全的大數據分析預警、空間天氣預報兩個仿真系統進行驗證,為應對大數據挑戰下的軍民數據分析需求提供基礎理論與技術手段。

結題摘要

大數據呈現出的大規模性、多模態性與增長性等特徵,使得傳統的數據分析理論、方法與技術面臨著可計算性、有效性與時效性等嚴峻挑戰。項目圍繞大數據環境下多粒度數據挖掘的核心挑戰,重點在大規模數據的特徵降維、信息粒化與粒計算模型、多粒度數據分析與挖掘、網路大數據挖掘等方面開展了理論研究,並在空間天氣預報與基於新聞評論的輿情分析等領域進行了套用研究。具體地:(1)在高效特徵降維方面,提出了符號數據、混合數據、動態數據和多模態數據的特徵降維方法;發展了基於多核模糊粗糙集、子空間聚類、遞歸正則化和區分矩陣的特徵降維方法。(2)在信息粒化與粒計算模型方面,提出了符號數據、集值數據、函式數據和動態數據的高效聚類算法;發展了基於樣本穩定性度量、類簇質量評估、劃分有效性評價的聚類集成算法;建立了局部粗糙建模方法。(3)在多粒度數據分析與挖掘方面,提出了多核、多視角、多標記的高效分類學習算法;發展了基於信息熵、標籤信任度的聚類集成高效算法。(4)在網路大數據挖掘方面,提出了面向拓撲與多源信息環境的鏈路預測方法和基於社區專家的推薦算法,提出了面向評論、跨語言、非平衡文本的情感傾向分析算法。(5)在套用研究方面,研製了空間太陽活動預報系統、災害性天氣預報系統、面向新聞評論的輿情分析系統和文本情感分析技術資源開放與服務平台。項目研究成果豐富了粒計算的基礎理論體系,為大數據的分析與挖掘提供了技術支撐。

相關詞條

熱門詞條

聯絡我們