基於馬氏抽樣的機器學習理論與算法研究

基於馬氏抽樣的機器學習理論與算法研究

《基於馬氏抽樣的機器學習理論與算法研究》是依託湖北大學,由鄒斌擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於馬氏抽樣的機器學習理論與算法研究
  • 項目類別:面上項目
  • 項目負責人:鄒斌
  • 依託單位:湖北大學
項目摘要,結題摘要,

項目摘要

隨著計算機技術的飛速發展,人們收集數據、存儲數據的能力得到了極大的提高。無論是科學研究, 還是社會生活的各個領域中都積累了大量的數據, 對這些數據進行分析以發掘出數據中蘊含的有用信息,幾乎成為所有領域的共同需求和要面臨的挑戰。在多年來對非獨立同分布數據下機器學習理論和算法研究的基礎上,我們提出了對數據進行馬氏抽樣以便更好發掘數據中有用信息的思想和方法。本項目旨在通過研究馬氏抽樣下機器學習算法的一致性、收斂速率和泛化性能,建立馬氏抽樣下機器學習的理論框架,進而對不同學習問題建立具有比較好的泛化性、穩定性和稀疏性等學習性能的馬氏抽樣方法,並將研究成果套用到數據挖掘的實際問題中,為數據挖掘,特別是海量數據挖掘提供數據分析的新技術和新方法。

結題摘要

在本項目中,我們對基於馬氏抽樣的機器學習理論和算法進行了全面系統的研究,在理論分析和算法設計兩個方面都取得了比較好的研究成果,主要研究內容包括:對基於馬氏抽樣的經典機器學習算法(如支持向量機分類,最小二乘正則化回歸,支持向量機回歸,LASSO, 線上支持向量機分類)的一致性、收斂速率和泛化性能進行了全面的研究:從理論上分析了基於馬氏抽樣的上述算法的泛化性能,證明了基於馬氏抽樣下上述算法是一致的,建立了基於馬氏抽樣的上述機器學習算法最優的收斂速率。這些理論研究成果的取得豐富和發展了經典的機器學習理論。在理論研究的基礎上,我們又對基於馬氏抽樣的機器學習算法的設計進行了研究,設計出了基於馬氏抽樣的支持向量機分類算法,基於馬氏抽樣的正則化回歸算法,基於馬氏抽樣的線上支持向量機分類算法。還提出了基於多次(k次)馬氏抽樣的支持向量機分類算法,該算法不僅具有比較好的泛化性能,而且所需的抽樣與訓練總時間更少,得到的分類器也更稀疏。這些算法為大數據的分析與挖掘提供了新思路和新方法。

相關詞條

熱門詞條

聯絡我們