《多視圖半監督聚類集成方法及套用研究》是依託西南交通大學,由楊燕擔任項目負責人的面上項目。
基本介紹
- 中文名:多視圖半監督聚類集成方法及套用研究
- 項目類別:面上項目
- 項目負責人:楊燕
- 依託單位:西南交通大學
項目摘要,結題摘要,
項目摘要
作為機器學習領域的新興研究熱點,多視圖聚類和半監督聚類集成技術受到越來越多的研究人員關注。尤其面對日益增長的大數據套用,數據日趨複雜且呈現多視圖的特性,現有的聚類算法無法完全適應這一挑戰。本項目擬對多視圖半監督聚類集成的關鍵技術進行系統研究,研究內容包括四部分:(1)分析特徵間的相似性與差異性等屬性,研究構建有效多視圖的方法;(2)建立同時滿足一致性和互補性的多視圖半監督聚類集成模型,合理運用協同訓練、約束傳遞和加權等策略,設計出最佳化的共識目標函式;(3)研究部分視圖不完整情況下的多視圖半監督聚類集成模型與算法;(4)研究多視圖半監督聚類集成方法在高鐵大數據中的套用。這些問題的解決,對於改善聚類質量,充分體現多視圖半監督聚類集成在解決大規模複雜數據問題中的優勢,完善多視圖學習、集成學習和半監督學習的理論與方法,提高數據挖掘與知識發現的性能和拓展多視圖半監督聚類集成的套用領域等有重要意義。
結題摘要
如何從蘊含大量信息的數據中進行有效的數據挖掘與知識發現,已成為當前信息科學領域的核心研究問題之一。本項目針對大數據套用領域中數據存在的多視圖特性,同時結合半監督學習與聚類集成方法進行了系統深入的研究,最終獲得更高質量和魯棒性的聚類結果。本項目旨在從方法與套用上系統研究多視圖半監督聚類集成模型,構建基於一致性、互補性、約束性和加權的共識目標函式,設計構建與評價多視圖的方法,探討視圖不完整場景下的解決方案,並以高鐵監測多視圖數據為對象,進行高速列車走行部的故障診斷。主要取得了以下成果:(1)分析原始數據中的隱含特徵與特徵之間蘊含的知識機理,實現了多視圖的構建;(2)在多視圖半監督聚類集成模型的研究方面,結合非負矩陣分解、子空間學習以及自動加權技術,提出了一系列多視圖聚類集成算法與半監督聚類集成模型;探討了基於粗糙集的多視圖聚類算法;構建了多任務場景下的多視圖聚類算法;(3)針對不完整視圖,基於譜聚類、圖理論與譜擾動理論,提出了不完備多視圖聚類方法;(4)面向高鐵大數據,分析高速列車振動信號特徵,引入半監督學習算法與多視圖聚類集成理論,結合非負矩陣分解技術與深度學習框架,實現了高速列車工況識別與故障診斷;(5)考慮多視圖半監督聚類集成方法在不同實際場景下的套用,針對自然語言處理問題、醫療輔助診斷以及教育大數據分析等領域,也展開了相關的研究工作並取得一系列成果;此外,開發了一套多視圖聚類分析系統,為用戶提供多視圖聚類分析服務。本項目共發表/錄用論文63篇,其中已被SCI和EI同時檢索6篇,EI檢索25篇;申請專利10項,授權專利2項;大會特邀報告9次;承辦國際學術會議4次;獲四川省計算機科學技術一等獎(由四川省計算機學會頒發,全省僅2名)。這些成果對改善多視圖聚類性能,完善半監督學習和集成學習的理論與方法,提高數據挖掘與知識發現的性能和拓展多視圖半監督聚類集成的套用領域等提供了學術思路與解決方案。