基於核學習的大型複雜數據挖掘理論與方法研究

《基於核學習的大型複雜數據挖掘理論與方法研究》是依託哈爾濱工業大學,由潘正祥擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於核學習的大型複雜數據挖掘理論與方法研究
  • 依託單位:哈爾濱工業大學
  • 項目類別:面上項目
  • 項目負責人:潘正祥
項目摘要,結題摘要,

項目摘要

大型複雜數據挖掘套用前景廣闊,準確預報故障以及快速檢測和識別故障是提高系統可靠性、減少事故危害的關鍵問題。如何從大量雜亂無章數據中抽取出有用信息並作為狀態的依據,一直是數據挖掘領域的研究熱點問題。目前大型複雜數據挖掘廣泛存在非線性、不確定性、結構特性和多源性等問題,本項目研究更適合大型複雜數據特點的數據挖掘新方法、新技術。針對大型複雜數據所具備的特點進行相應的研究工作,將核學習思想用於大型複雜數據的分類、聚類、時間序列預測以及不確定問題,提出了核自適應學習的思想,核結構自適應於輸入數據分布,有效提升大型複雜數據分類和聚類的性能;提出了自適應核遞歸方法並將其用於複雜時間序列的預測,提升時間序列的預測精度;搭建了基於核學習的大型數據挖掘驗證平台,建立核學習的綜合數據評價體系與標準。

結題摘要

本項目按照任務書要求和時間節點,針對大型複雜數據挖掘廣泛存在非線性、不確定性、結構特性和多源性等問題,研究了更適合大型複雜數據特點的數據挖掘新方法、新技術。本項目針對大型複雜數據所具備的特點進行相應的研究工作。具體研究成果如下,將核學習思想用於大型複雜數據的分類、聚類、時間序列預測以及不確定問題,提出了核結構自適應於輸入數據分布的核自適應學習算法,有效提升大型複雜數據分類和聚類的性能;提出了自適應核遞歸方法並將其用於複雜時間序列的預測,提升時間序列的預測精度;搭建了基於核學習的大型數據挖掘驗證平台,建立核學習的綜合數據評價體系與標準,在遙感大數據、紅外圖像大數據集上進行了綜合測試算法,算法在遙感大數據分析系統及數據分析方面得到了重要套用,對飛機、橋樑典型目標識別中,獲得95%的識別正確率。 依託項目發表論文23篇,其中SCI檢索期刊論文17篇,EI會議論文6篇,培養研究生11人,獲得省部級獎勵1項,主辦國際會議16次,作大會特邀報告2次。 該項目成果對未來的準確預報故障以及快速檢測和識別故障是提高系統可靠性、減少事故危害等方面具有重要的實際價值,並對大量雜亂無章數據中抽取出有用信息及有效解決目前大型複雜數據挖掘廣泛存在非線性、不確定性、結構特性和多源性等問題具有重要理論價值。

相關詞條

熱門詞條

聯絡我們