多重代價失衡的機器學習技術研究

多重代價失衡的機器學習技術研究

《多重代價失衡的機器學習技術研究》是依託南京師範大學,由楊明擔任項目負責人的面上項目。

基本介紹

  • 中文名:多重代價失衡的機器學習技術研究
  • 項目類別:面上項目
  • 項目負責人:楊明
  • 依託單位:南京師範大學
項目摘要,結題摘要,

項目摘要

代價風險最小化是目前有效的分類決策判別準則之一,倍受國內外機器學習和模式識別研究者的關注。降維和代價敏感學習是改進代價失衡分類器性能的有效策略,但當前同時進行多重代價(錯分代價、屬性代價等)最小化的分類器研究還不多見,而多重代價失衡在數據不平衡等分類問題中普遍存在。為此,本項目旨在尋求特徵選擇的新策略、多重代價最小化的分類模型設計及多重代價最小化的集成分類器設計三個方面展開研究。側重研究:1、提出基於假設間隔、信息熵、Filter-Wrapper模型的特徵選擇新方法,構建出多重代價最小化新準則下的特徵選擇新算法;2、提出局部結構保持的監督(半監督)特徵選擇新算法,探尋併入多重代價最小化的新策略;3、設計嵌入代價敏感學習策略的監督(半監督)分類模型;4、設計併入代價敏感學習和特徵選擇的分類器模型。以上述研究為基礎,進而研究1、一類多重代價最小化的分類器設計;2、多重代價最小化的分類器的集成。

結題摘要

代價敏感學習是解決代價失衡問題的重要機器學習方法,具有理論和套用研究價值。項目組圍繞代價敏感的降維和分類器設計、結合標記相關性的多標記學習、基於假設間隔的特徵選擇、字典學習和圖像去噪展開了深入的研究。具體地說,項目組提出了一類嵌入代價敏感的降維和分類學習算法,論文發表在IEEE TIFS(CCF A)、Neurocomputing(CCF C)、NEURAL PROCESS LETT(CCF C)、軟體學報等國內外學術期刊上。針對多標記數據的不平衡性,採用多任務學習框架,利用標記相關性,提出了一類面向多標記數據的學習算法,論文發表在軟體學報、電子學報等國內學術期刊上。同時,項目組圍繞特徵表示和圖像去噪進行了相關研究,論文發表在IEEE TCSVT(CCF B)、Pattern Recognition(CCF B)和Image Vision and Computing(CCF C)等國內外學術期刊上。此外,項目組在聚類分析、特徵選擇和SVM分類算法等方面進行了研究,論文發表在Knowledge-Based Systems(CCF C)和《控制與決策》等國內外學術期刊上。目前,有關嵌入代價敏感的降維算法研究相對較少,項目組的研究成果是該方面研究的有效補充,受到同行的關注。利用標記相關性,設計了多標記分類和特徵選擇聯合學習框架,該框架也是解決數據不平衡引起的代價失衡問題的有效途徑。同時,項目組進行了字典學習和圖像去噪等相關研究,為未來進行面向多標記數據分類的判別型字典學習研究打下了必要的基礎。

相關詞條

熱門詞條

聯絡我們