大數據環境下基於同步原理的數據流挖掘算法研究

大數據環境下基於同步原理的數據流挖掘算法研究

《大數據環境下基於同步原理的數據流挖掘算法研究》是依託電子科技大學,由邵俊明擔任醒目負責人的青年科學基金項目。

基本介紹

  • 中文名:大數據環境下基於同步原理的數據流挖掘算法研究
  • 依託單位:電子科技大學
  • 項目類別:青年科學基金項目
  • 項目負責人:邵俊明
項目摘要,結題摘要,

項目摘要

信息技術的快速發展使得高速數據流正以前所未有的速度在各個領域不斷地產生,如實時監控系統、氣象衛星遙感、移動通信網、社交網路及電子商務等。由於數據流具有海量性、時序性、演化性及潛在無限性等特點,目前大規模數據流分析面臨時空複雜度高、數據演化跟蹤與學習困難及數據源複雜等問題。申請人前期的研究表明同步原理是數據分析和挖掘的一個有力機制,且基於同步原理的分析方法具有的動態性、局部性及多尺度分析特性很好地契合了目前大規模數據流挖掘面臨的問題和挑戰。因此,本研究擬在大數據時代背景下,以同步原理為新視角,從數據流的聚類分析和分類預測兩個方面展開深入的理論研究,探討其面臨的關鍵技術,提出新的數據流聚類和分類挖掘算法並在大規模數據流集上進行驗證,提高人們從海量數據流中挖據和提煉知識的能力。

結題摘要

項目按照原定計畫進行,完成了的基於同步原理的大規模數據流聚類分析和分類算法研究。針對數據流具有的海量性、時序性、演化性及潛在無限性等特點,項目以同步原理為新視角,從數據流的聚類分析和分類預測兩個方面展開深入的理論研究,探討了其面臨的關鍵技術,提出了新的數據流聚類和分類挖掘算法並在大規模數據流集上進行驗證,提高人們從海量數據流中挖掘和提煉知識的能力。因此,執行情況概述分為三部分,第一部分是基於同步原理的大規模數據流聚類分析:主要包括基於同步的大規模數據聚類算法研究、子空間聚類算法研究和數據流上的聚類算法研究。第二部分為基於同步的大規模數據流分類算法研究:主要包括基於同步的數據流分類研究、數據流上的半監督學習和分散式數據流算法研究。此外,在研究基礎上,進一步擴展了相關研究。因此,第三部分為數據流挖掘在各個領域的套用研究:主要包括基於數據流的徑流時空演化研究和腦科學上的套用研究。

相關詞條

熱門詞條

聯絡我們