價值模式挖掘及套用研究

《價值模式挖掘及套用研究》是依託北京航空航天大學,由吳俊傑擔任項目負責人的面上項目。

基本介紹

  • 中文名:價值模式挖掘及套用研究
  • 依託單位:北京航空航天大學
  • 項目負責人:吳俊傑
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

關聯分析是數據挖掘這一新興交叉學科的核心領域。其從大規模複雜數據中尋找關聯模式,並套用於商務智慧型、信息安全、計算機網路、生物醫學、地理信息等眾多重要領域。研究表明,傳統的關聯分析由於依賴支持度-置信度框架,容易產生大量無價值甚至錯誤的關聯模式。而利用興趣度指標對關聯模式進行後評價,也無法根本解決計算成本過高的問題。有鑒於此,本項目研究真正有價值的關聯模式即價值模式的挖掘問題,其核心在於把興趣度指標融入價值模式的挖掘過程中,其難點在於解決指標因缺乏反單調性而無法實現遍歷空間剪枝的問題。具體而言,本項目首先將從眾多興趣度指標中篩選出性能優良的指標,然後針對指標設計通用的價值模式挖掘算法,最後將該算法固化到價值模式挖掘系統中,並套用於移動商務推薦、搜尋推薦及廣告投放、突發事件監測等重要熱點領域。本項目的研究有望對關聯分析的理論和套用實踐提供重要的補充和推動作用。

結題摘要

由於問題的普遍性和複雜性,從大數據中尋找價值模式(interesting pattern),並將之套用於商務智慧型、信息安全、計算機網路、生物醫學、地理信息等眾多實踐領域,已經成為大數據分析的核心任務之一。課題組在歷時四年的研究中,秉持“頂天立地”的原則,不僅積極發表具有國際頂尖水平的價值模式挖掘理論成果,而且大力開展產學研建設以將理論成果轉化為社會輿情管理的重要助力。課題組取得的學術貢獻包括:(1)在“局部價值模式挖掘”領域,第一次清晰指出了傳統“支持度—置信度”框架的缺陷;通過證明餘弦(cosine)乃至泛化的廣義均值(generalized mean)具有新穎的“條件反單調性”,提出了基於餘弦的價值模式挖掘算法,以及基於廣義均值的價值模式挖掘一般性框架,並將挖掘算法推廣至分散式計算環境,從根本上解決了大數據計算問題;通過將價值模式成功套用於噪聲圖像過濾、社交網路群體抽取、冷門產品推薦等問題,證明了其優越性及樂觀的產業化前景。(2)在“全局價值模式挖掘”領域,針對聚類分析中使用最廣的K-均值算法,從泛化理論、算法分析、算法設計、客觀評價、組合聚類等方面進行了全面而深入的研究,形成了一套完整的成果體系,奠定了課題組在該領域的國際影響力。(3)在新興的“社會化媒體大數據挖掘”領域,以上述價值模式挖掘技術為基礎,圍繞社會事件分析、用戶情感分析、信息傳播分析、潛在欺詐檢測等熱點問題,開展了大規模的理論與套用研究,理論價值與社會經濟效益均顯著。截至2016年1月18日,課題組已發表(含接收)共34篇標註課題資助的學術論著,其中包括1本Springer出版英文專著、21篇SCI檢索論文(含6篇IEEE Trans.論文)、11篇數據挖掘頂級會議論文(含2篇KDD和4篇ICDM論文)。形成了一批面向社會化媒體大數據的實踐套用成果,其中包括11項國家發明專利申請(1項已獲批)、2項獲批軟體著作權(已技術入股某創業公司)、為工信部某中心構建的“社會輿情分析與管理”平台、為國安部某局構建的“台灣選情預測平台”等。項目負責人依託本課題支持,成長為NSFC優青,並主持了NSFC重點項目、科技部863項目、工信部信息安全項目等國家級課題,在日漸頻繁的國際、國內交流合作中,逐步成長為社會化媒體大數據分析領域的重要研究力量。

相關詞條

熱門詞條

聯絡我們