基於先驗知識的支持向量機的最最佳化模型與算法研究

《基於先驗知識的支持向量機的最最佳化模型與算法研究》是依託中國農業大學,由鐘萍擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於先驗知識的支持向量機的最最佳化模型與算法研究
  • 依託單位:中國農業大學
  • 項目負責人:鐘萍
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

本項目擬研究的支持向量機是當今國內外研究的熱點之一。它是數據挖掘中的一項新技術,以最最佳化方法為實現手段,是解決分類問題和回歸問題的有效工具。在通常的支持向量機的研究中,人們都默認了學習數據集是根據某個未知但固定的分布獨立同分布產生的假設。然而,在很多實際問題中,學習的數據集是具有先驗知識的,如數據集中含有噪聲或異常值,數據集不平衡,數據中含有特定的信息等。忽略數據集先驗知識建立的模型往往不能很好地滿足實際問題的需求。本項目擬研究基於數據集先驗知識的支持向量機的模型和算法。具體地包括:建立支持向量機的魯棒模型及其能夠求解大規模魯棒模型的DCA算法;通過構造基於數據集的核函式建立不平衡數據集的支持向量機模型和算法;建立利用數據中的特有信息進行學習的支持向量機模型和算法。在國內外,對本項目的研究尚處於初級階段。因此本項目的研究將有利於推動支持向量機在理論和套用實踐方面的進一步發展。

結題摘要

支持向量機是機器學習中的一項重要的新技術。隨著深入研究,人們發現在許多的實際問題中,數據集往往具有先驗知識。例如,數據中含有異常值;數據集不平衡;數據中含有隱藏信息。我們針對該問題進行了深入地研究,內容有:研究支持向量機的魯棒模型和求解算法;研究處理不平衡數據集的支持向量機模型和算法;研究學習數據的隱藏信息的支持向量機模型。我們取得了一系列研究成果,很好地豐富了支持向量機的理論和套用。主要成果有: (1)對魯棒模型的研究:a.構造了非凸有界的最小二乘損失函式,建立了相應的魯棒模型和DC規劃;b.提出了一種斜率、間隔可變的廣義有界損失函式,並建立了相應的魯棒模型和牛頓求解算法;c.提出一種能夠抑制異常值的絕對偏差損失函式,並建立了相應的魯棒模型;d.建立了基於非凸二次損失函式的支持向量回歸機魯棒模型和求解算法。我們利用標準數據,金融時間序列數據,以及排序數據,對這些魯棒模型進行了測試, 結果顯示它們在魯棒性和泛化能力方面都有顯著的優勢。 (2)對不平衡數據集的支持向量機研究:a. 建立了最小二乘模糊單分類支持向量機模型;b. 對正包和負包不平衡的多示例問題,構建了逐次疊代的最小二乘支持向量機模型;c. 構建了最小二乘雙胞胎支持向量機的多示例模型和求解算法。利用標準數據集對這些模型進行測試,結果顯示它們在處理不平衡數據集上有很好的效果。 (3)對學習隱藏信息的模型研究:a. 提出了基於數據額外信息的單分類支持向量機;b. 受Fisher判別法的啟發,建立了基於隱藏信息的最小化類方差支持向量機; c.建立了利用數據分組信息的相對間隔支持向量機; d.建立了基於特權信息的多分類支持向量機。利用UCI數據集對這些模型進行了測試,實驗結果表明這類模型能夠大大提高泛化能力。 以上成果發表在國際一流期刊Knowledge-Based Systems,SCI檢索期刊Neural Processing Letters,Mathematics Problems in Engineering, Advances in Data Analysis and Classification,EI檢索期刊International Journal of Signal Processing, Image Processing and Pattern Recognition等。

相關詞條

熱門詞條

聯絡我們