特異群組挖掘算法研究

《特異群組挖掘算法研究》是依託復旦大學,由朱揚勇擔任項目負責人的面上項目。

基本介紹

  • 中文名:特異群組挖掘算法研究
  • 依託單位:復旦大學
  • 項目類別:面上項目
  • 項目負責人:朱揚勇
項目摘要,結題摘要,

項目摘要

特異群組挖掘是一種新的數據挖掘任務,套用領域廣泛,具有重要的套用價值。聚類、異常挖掘和特異群組挖掘屬於根據數據對象的相似性來劃分數據集的數據挖掘問題。其中,聚類是將大部分具有相似性的數據對象分到若干個簇中的過程;異常挖掘發現數據集當中明顯不同於大部分對象(具有相似性)的數據對象;而特異群組挖掘是發現數據集當中明顯不同於大部分數據對象(不具有相似性)的數據對象,其在問題定義、算法設計和套用效果都不同於聚類和異常挖掘,不能由現有的聚類、異常等數據挖掘技術實現。本項目在課題組前期工作的基礎上,研究特異群組挖掘問題的形式化並設計特異群組挖掘算法,建立一個特異群組挖掘理論體系。主要研究內容包括:①特異群組挖掘問題的形式化;②特異群組的特異性度量的定義;③特異群組挖掘算法的設計;④BenchMark數據集的建立。本項目研究成果將為特異群組挖掘技術研究和套用奠定理論基礎。

結題摘要

高價值低密度常常被用於描述大數據的特徵,挖掘高價值低密度的數據對象是大數據的一項重要工作。特異群組是一類高價值低密度的大數據形態。本項目針對特異群組挖掘任務進行了深入的研究,即如何在大數據集中發現那些少部分具有相似性的對象形成的群組,而大部分數據對象不在任何組中,也不和其他對象相似。研究成果包括特異群組挖掘任務的系統闡述,特異群組挖掘任務與聚類、異常等任務之間的差異分析,特異群組挖掘任務的形式化定義,特異群組的特異性度量,一系列特異群組挖掘算法的研究設計,構建特異群組挖掘BenchMark數據集,並將所提出的算法在這些真實數據集上實現和套用,最終形成了特異群組挖掘形式化框架和理論體系,為特異群組挖掘技術研究和套用奠定理論基礎。

相關詞條

熱門詞條

聯絡我們