面向大規模數據流的集成學習模型與方法研究

《面向大規模數據流的集成學習模型與方法研究》是依託重慶大學,由王昱擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向大規模數據流的集成學習模型與方法研究
  • 項目類別:面上項目
  • 項目負責人:王昱
  • 依託單位:重慶大學
中文摘要,結題摘要,

中文摘要

近年來,隨著網路化信息技術在各個行業的廣泛套用,數據挖掘所面向的主要數據形態已由靜態數據轉變為具有海量性、動態性、概念漂移性等特性的大規模數據流,從而使得傳統的數據挖掘技術很難有效地進行數據學習和知識發現。本項目針對網路環境下大規模數據流的特性,基於集成學習理論方法開展數據挖掘和知識發現研究,探討大規模數據流中存在的特性對數據學習的效率和準確率的影響,並研究如何更加高效和準確地找出具有共性或規律性的信息和知識。項目的主要研究內容包括:(1)大規模數據流中的概念知識的形式化表示以及概念漂移檢測;(2)具有增量性和可擴展性的集成學習模型及算法;(3)針對概念漂移的動態演化集成學習模型與算法;(4)基於集成學習的客戶動態細分方法及軟體系統原型。本項目從方法論的角度對面向大規模數據流的集成學習方法和技術進行研究,有助於提高企業和組織套用數據挖掘進行決策支持的水平,具有重要的理論意義和套用價值。

結題摘要

近年來,隨著網路化信息技術在各個行業的廣泛套用,數據挖掘所面向的主要數據形態已由靜態數據轉變為具有海量性、動態性、概念漂移性等特性的大規模數據流,從而使得傳統的數據挖掘技術很難有效地進行數據學習和知識發現。本項目針對網路環境下大規模數據流的特性,基於集成學習理論方法開展數據挖掘和知識發現研究,探討大規模數據流中存在的特性對數據學習的效率和準確率的影響,並研究如何更加高效和準確地找出具有共性或規律性的信息和知識。項目已開展的主要研究內容包括:(1)針對大規模數據中特徵空間異質性的測度與分類方法研究;(2)具有增量性和可擴展性的改進K-近鄰規則及其套用研究;(3)針對概念漂移的動態演化集成學習模型與算法;(4)基於集成學習的消費者信用評估、資料庫行銷、海關查驗走私等風險決策問題。本項目從方法論的角度對面向大規模數據流的集成學習方法和技術進行研究,有助於提高企業和組織套用數據挖掘進行決策支持的水平,具有重要的理論意義和套用價值。

相關詞條

熱門詞條

聯絡我們