高維數據檢驗問題中的稀疏方法及其套用

高維數據檢驗問題中的稀疏方法及其套用

《高維數據檢驗問題中的稀疏方法及其套用》是依託浙江師範大學,由沈炎峰擔任項目負責人的數學天元基金項目。

基本介紹

  • 中文名:高維數據檢驗問題中的稀疏方法及其套用
  • 依託單位:浙江師範大學
項目摘要,結題摘要,

項目摘要

隨著高通量技術的迅速發展,各種高維數據的收集變得越來越容易和自動化,這些新型數據的一個顯著特徵是變數個數與樣本量相差不多或者會遠大於樣本量。很多經典的統計方法對高維數據已經不再適用,需要發展一套全新的統計方法和理論,以適應這種高維數據分析的需要。稀疏性假設和變數選擇已經成為統計學習中的一個熱門課題,然而把變數選擇技術整合到高維假設檢驗的研究還相對比較少。本項目將針對高維檢驗中的熱點問題和高維數據的稀疏性特點,著重討論高維下多樣本問題和多個總體均值和協方差陣同時檢驗問題,擬建立一個適用於稀疏高維數據分析的檢驗方法體系,從而克服傳統方法在高維情形下的困難。在理論研究的基礎上,開發基於R語言的程式算法,同時用隨機模擬和實例分析來驗證這些新方法的可行性和有效性。本項目的研究不僅拓廣了高維數據分析的理論,而且進一步推進了統計學在生物醫學中的套用,具有較高的理論價值和廣闊的套用前景。

結題摘要

本研究項目針對高維檢驗中的熱點問題和高維數據的稀疏性特點,在高維情形的多樣本均值檢驗問題和多個總體均值與協方差陣同時檢驗問題等方面取得了一些研究成果。通過把變數選擇技術整合到高維檢驗之中,建立了一個適用於稀疏高維數據分析的檢驗方法體系,並且獲得了檢驗統計量的極限分布,取得了若干有特色的創新成果。在理論研究的分析上,編寫基於R語言的程式算法,同時用數值模擬和真實數據分析來驗證這些新方法比傳統方法能更有效地檢測稀疏性數據。本研究工作在一定程度上拓展了高維數據分析的統計方法,同時也進一步推進了統計學在生物醫學中的套用。

相關詞條

熱門詞條

聯絡我們