基於隨機矩陣理論的高維數據統計分析

基於隨機矩陣理論的高維數據統計分析

《基於隨機矩陣理論的高維數據統計分析》是依託吉林大學,由姜丹丹擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於隨機矩陣理論的高維數據統計分析
  • 項目類別:青年科學基金項目
  • 項目負責人:姜丹丹
  • 依託單位:吉林大學
項目摘要,結題摘要,

項目摘要

隨著現代科學和計算機技術的飛速發展,高維數據出現在了諸多新興領域中。然而當維數升高時,經典統計量的極限分布不能很好地描述統計量的真實(或近似)極限性狀,或者經典理論完全失效(統計量趨於無窮)。我們的工作是將高維隨機矩陣譜理論套用於高維數據統計分析問題,對經典的似然比檢驗作出必要而有效的修正,和經典多元統計方法以及其他一些高維數據分析方法相比較,得到更為有效的不依賴正態總體分布的檢驗方法。通過模擬試驗,我們可以驗證這一論述。我們主要考慮的問題包括高維數據的回歸分析和典則相關分析等。同時,還將相關的研究理論套用關於生物醫藥統計和無線通訊信號網路等實際當中。
zhua曲子白渡白顆

結題摘要

我們研究的主要內容是探討了當前十分熱門的大維數據分析問題,創新之處是將高維隨機矩陣譜理論套用於大維數據統計分析問題,對經典的似然比檢驗作出必要而有效的修正,和經典多元統計方法以及其他一些高維數據分析方法相比較,得到更為有效的不依賴正態總體分布的檢驗方法。通過大維隨機矩陣線性譜統計量的中心極限定理,考慮了在樣本量和數據維數成比例增長的前提下的線性回歸分析、獨立性檢驗、方差檢驗以及多重相關分析等問題。其中多重相關分析和回歸分析等問題,不能直接依賴現有的大維隨機矩陣線性譜統計量的中心極限定理,我們通過利用Stieljes變換等手法,在原有的基礎上推導出適用的理論工具,從而得出新的有效的檢驗方法。當維數升高時,經典統計量的極限分布不能很好地描述統計量的真實(或近似)極限性狀,或者經典理論完全失效(統計量趨於無窮),而新的理論方法能夠彌補這一缺陷,避免經典多元統計分析方法在處理大維數據時出現的嚴重偏差甚至完全失效的怪異現象。雖然項目的研究成果是基於樣本量和數據維數成比例增長的大維假設,但是理論結果卻能夠兼顧高維和低維數據的不同情形,對於維數具有一定的穩健性,通過模擬實驗我們可以看到新的檢驗辦法在實際套用有效可行。在現代科學和計算機技術的飛速發展的背景下,大維數據分析在生物、醫藥、無線電通訊等領域中都有著廣泛的套用,因此,研究結果具有一定的實際意義。

相關詞條

熱門詞條

聯絡我們