基於數據固有結構的稀有事件預測分析

《基於數據固有結構的稀有事件預測分析》是依託北京航空航天大學,由吳俊傑擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於數據固有結構的稀有事件預測分析
  • 依託單位:北京航空航天大學
  • 項目負責人:吳俊傑
  • 項目類別:青年科學基金項目
項目摘要,結題摘要,

項目摘要

稀有事件如信用卡欺詐、財務困境、設備故障等是企業長期關注的管理難題,其突發性和破壞性可能給企業帶來難以估量的損失。在實踐需求的推動下,稀有事件預測研究迅速成為數據挖掘領域的熱點問題,大量套用導向型算法被陸續提出,並取得了不錯的效果。儘管如此,對於影響稀有事件預測精度的重要因素之一- - 數據固有結構,人們仍然缺乏清晰的認識;已有算法在面對具有複雜數據結構的訓練樣本時,也常常表現不佳。有鑒於此,本項目研究基於數據固有結構的稀有事件預測系統。具體而言,本項目首先研究數據固有結構對稀有類分析的影響機理,以及它和樣本不均衡性的聯合作用機理,然後在此基礎上設計針對數據固有結構以及數據不同稀缺程度的稀有類分析算法,最後設計並實現以該算法為核心的稀有類分析決策支持系統,並嘗試在金融領域做套用及案例研究。本項目的研究將為我國稀有事件預測和管理的理論及實踐領域提供有益參考。

結題摘要

由於問題的普遍性和複雜性,稀有類分析在商務智慧型領域長期占據了特別重要的位置。在傳統的商務問題中,信用卡預測和網路入侵檢測等就是典型的稀有類分析問題。隨著Web 2.0的蓬勃發展,社會媒體及社會化商務紛紛湧現,稀有類分析在諸如線上商品評論托攻擊識別、海量微博情感分析等前沿領域迅速成為核心問題之一。本項目立足於設計數據挖掘算法識別海量複雜數據中的固有結構,然後基於數據的固有結構建立準確高效的稀有類分析模型及系統,並套用於上述傳統及前沿商務問題。課題組成員在為期三年的研究中取得如下重要研究成果:(1)通過識別大規模複雜數據的局部結構和邊界結構,設計了新穎的稀有類分析算法,取得很好的套用效果並成為稀有類分析的新分支之一;(2)在大數據的聚類結構、關聯結構和連線結構挖掘方面,開展了一系列理論和算法的創新研究,形成了體系化的研究成果,並在國際主流學術陣地獲得發表;(3)基於上述成果對社會網路信息擴散、線上商品評論托攻擊檢測以及海量微博情感分析等熱點領域展開研究,成果除高水平學術論文外還有上線系統,在國內外學術及工業界取得較大反響。上述成果已形成25篇標註課題資助的學術論著獲得發表,其中22篇中課題負責人為第一作者(含學生第一、本人第二作者)或通訊作者。論著包括1本Springer Berlin出版的英文專著、1篇美國《SCIENCE》專刊論文、16篇SCI檢索期刊論文(含4篇影響因子3.0以上的IEEE Transactions論文、1篇數據挖掘領域最頂級期刊DMKD論文)、2篇數據挖掘領域頂級會議ACM KDD論文,在數據挖掘與商務智慧型領域具有廣泛影響力。另有2個系統套用平台已在網上發布,其一為“國際會議管理信息系統”,另一為“新浪微博輿情分析平台”,獲得學術界和工信部等政府機構的廣泛關注,並取得了後續重點項目支持以取得落地成果。基於上述工作,課題負責人獲評“教育部新世紀優秀人才”(2011)並應邀成為微軟亞洲研究院“Star Track”訪問學者;建立了“社會計算與社會輿情分析中心”並擔任執行主任;被教育部人文社科重大基地、清華大學現代管理研究中心聘為校外研究員(為信息管理方向唯一獲聘校外副教授,其餘均為正教授);常態擔任KDD、《Management Science》等頂級會議和期刊的審稿專家;協助指導了5位博士生,其中已畢業2位已在中央財經大學等高校任教。

相關詞條

熱門詞條

聯絡我們