面向高維小樣本數據的集成分類方法研究

《面向高維小樣本數據的集成分類方法研究》是依託西安交通大學,由張春霞擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向高維小樣本數據的集成分類方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:張春霞
  • 依託單位:西安交通大學
中文摘要,結題摘要,

中文摘要

獲取泛化能力強的分類器是解決模式分類問題的主要目標。但實際中的高維小樣本數據會引起Hughes 現象,導致傳統分類算法中的參數估計偏差過大,在訓練過程中產生過學習,使得得到的分類器有偏或不穩定,泛化能力差。集成學習用多個基分類器解決同一問題,在提高單個分類器的泛化能力和穩定性方面優勢顯著,具有解決高維小樣本分類問題的潛力。本項目將採用降維技術與集成學習相結合和特徵空間自動劃分的方法,有效利用高維特徵提供的判別信息,結合基分類器之間的好壞多樣性及數理統計領域的知識,構造能有效克服數據小樣本性的基分類器融合準則,設計面向高維小樣本數據的集成分類算法,分析新算法的有效性、計算複雜性和對噪聲的穩健性等,並套用其解決往復式壓縮機故障診斷和高光譜圖像分類等實際問題。該研究不僅可以完善集成學習的理論基礎,也將為解決自然科學和國民經濟各領域的同類問題提供有效方法。

結題摘要

本項目主要研究在高維小樣本情況下,集成學習方法在解決模式分類問題中的相關理論、算法及套用。所取得的主要成果集中在下述幾個方面:集成學習在不平衡數據分類中的套用,基於深度學習的特徵提取與降維,回歸和分類模型中的變數選擇以及相關算法在遙感圖像處理中的套用。 在不平衡數據分類的研究方面,提出了一種具有更強泛化能力的基於探索性欠採樣和特徵變換的選擇性集成分類算法;基於隨機下採樣技術和隨機樹分類算法,提出了一種新的集成分類算法IRUSRT;對於敏感損失的boosting集成學習算法,我們通過試驗分析了誤分損失和數據的不平衡度對算法性能的影響程度,為算法在實際中的套用提供了一些建議。 在基於深度學習的特徵提取和降維方面,我們探討了利用受限波爾茲曼機RBM來輔助構建集成分類器的方法,研究了利用RBM來輔助構建集成分類器的方法,得出了一些有指導性的結論;提出了一種對變換具有不變性的分類RBM算法,達到了較高的分類精度;提出了一種新的稀疏RBM模型LogSumRBM,提高了RBM的數據表示能力;建立了基於率失真理論的深度信念網模型,極大地減少了編碼中的信息率、提取了更抽象的特徵,並學習到了更具判別能力的表示;提出了一種堆疊的無監督的極端學習機算法,能更高效地提取出更有意義的特徵。 在回歸和分類模型的變數選擇方面,我們利用boosting算法的思想,基於遺傳算法,提出了一種新的構建變數選擇集成的方法,達到了更高的選擇精度;在並行遺傳算法PGA算法的基礎上,提出了一種新的算法RandGA,能更好地檢測出真正重要的自變數。 在遙感圖像處理的研究方面,我們基於多光譜圖像融合的自適應的強度、色度和飽和度方法(AHIS),提出了一種改進的IAIHS算法,可以更充分地利用每一個多光譜圖像的空間信息,並保證融合後所得圖像的光譜質量;將壓縮感知理論用於高光譜圖像的端元提取,增強了解混效果。 本項目的研究截至目前共發表相關期刊論文18篇,其中SCI檢索13篇。

相關詞條

熱門詞條

聯絡我們