大數據環境下稀有類數據挖掘研究

大數據環境下稀有類數據挖掘研究

《大數據環境下稀有類數據挖掘研究》是依託武漢大學,由黃浩擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:大數據環境下稀有類數據挖掘研究
  • 項目類別:青年科學基金項目
  • 項目負責人:黃浩
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

大數據中的稀有類蘊藏著巨大的潛在價值,挖掘出它們常會帶來重要的新發現、新知識。但是稀有類僅有少量數據樣本且常隱匿在大數據子維度空間中,使其挖掘工作具有較大困難和挑戰。而現有稀有類數據挖掘研究往往忽略大數據中稀有類的子維度空間特性,且其算法計算代價較大,因而限制了它們在大數據上的可用性。因此,本項目將以大數據環境為研究背景,以準確、高效地挖掘出海量高維數據集中稀有類為核心目標,系統研究符合實際套用特點和套用需要的稀有類數據挖掘算法,包括面向大數據的稀有類檢測算法和分類算法,解決如何合理分解大數據、如何有效獲取稀有類分類查找空間、如何設計針對稀有類的降維技術等關鍵科學問題,保證所提方法的可用性、效率及性能。同時,擬建設一個集成本項目主要研究成果的稀有類數據挖掘算法展示平台,以作為今後研究成果向實際套用推廣的基礎平台。

結題摘要

大數據中的稀有類蘊藏著巨大的潛在價值,但其數據樣本卻常常難以被發現,因此如何快速準確地從大數據中挖掘出這些稀有類數據樣本是一個較大的挑戰。本項目圍繞稀有類數據挖掘技術展開了深入的探索,重點研究了稀有類檢測技術、稀有類分類技術以及圖數據、眾包數據中稀有類數據挖掘。項目組達到並超出了預期的研究目標。共培養/畢業相關方向的博士生3名、碩士生5名,獲國家獎學金1人次、校級優秀研究生表彰2人次;在國際頂級/重要學術會議AAAI 2019、VLDB 2018、DASFAA 2018、DASFAA 2017、APWeb 2016、DEXA 2016,以及國內外權威學術期刊Knowledge and Information Systems、Computer Journal、Journal of Intelligent Information Systems、軟體學報上發表/錄用高水平研究論文12篇,其中SCI檢索3篇,EI檢索9篇,CCF(中國計算機學會)推薦的A類會議長文1篇、A類會議Demo論文1篇、B類會議或期刊論文5篇、C類會議論文3篇、國家一級學報論文2篇;申報國家發明專利5項,其中2項已授權;搭建了一個稀有類數據挖掘算法展示平台;同時,部分研究成果已在華中地區最大的座席外包專業服務機構——武漢新光電網科信息技術有限公司得到了較為成功的落地套用。

相關詞條

熱門詞條

聯絡我們