部分特徵值統計量的中心極限定理及其套用

部分特徵值統計量的中心極限定理及其套用

《部分特徵值統計量的中心極限定理及其套用》是依託吉林大學,由姜丹丹擔任項目負責人的面上項目。

基本介紹

  • 中文名:部分特徵值統計量的中心極限定理及其套用
  • 項目類別:面上項目
  • 項目負責人:姜丹丹
  • 依託單位:吉林大學
項目摘要,結題摘要,

項目摘要

在大數據時代,由於數據爆炸式的增長,經典數理統計中的理論結果和統計方法不再適用,急需一套有力的理論工具來處理大維數據的統計分析問題。大維隨機矩陣譜理論的發展為解決相關問題提供了理論支持,並被廣泛套用於信息、金融、醫學、生物、心理學以及政府服務等各個領域。但是,關於大維主成分分析和因子分析的檢驗的問題,還鮮有文章涉及,而這類問題在信號處理、經濟數據分析以及心理學等方面都有重要套用。因此,本項目運用大維隨機矩陣譜理論,推導大維樣本協方差矩陣的部分特徵值的線性譜統計量的中心極限定理,並以此為理論工具提出大維總體主成分的個數的檢驗方法以及大維因子分析中模型擬合的檢驗方法,並將其套用於各領域中的實際問題,從而拓寬大維隨機矩陣理論在大維數據分析中的套用範圍,使之擁有更廣闊的套用前景。

結題摘要

在大數據時代,由於數據爆炸式的增,經典數理統計中的理論結果和統計方法不再適用,急需一套有效的理論工具來處理大維數據的統計分析問題。大維隨機矩陣譜理論的發展為解決相關問題提供理論支持,並被廣泛套用於信息、金融、醫學、生物、心理學以及政府服務等各個領域。但是,立項之初關於大維主成分分析和因子分析的檢驗的問題,還鮮有文章涉及。因此,本項目立項初衷是為了研究大維海量數據的主成分分析和因子分析。考慮當維數p和樣本量n成比例趨於無窮時,利用大維隨機矩陣的譜理論提出大維總體主成分的個數的檢驗方法以及大維因子分析中模型擬合的檢驗方法。我們主要考慮的兩個檢驗問題是:大維總體主成分的個數的檢驗以及大維因子分析中模型擬合的檢驗。根據主成分分析和因子分析的性質,相當於將原來數據的信息主要體現在一部分主要影響的因子上,即主成分(或起主要作用的因子)。這樣其對應的方差就具有一定的特殊結構,比如部分特徵值明顯不同於其他。因此,我們或通過檢驗其方差結構的特殊性,以此來確定明顯不同於其他的特徵值的個數,就可以相應的確定主成分或者因子的個數;或通過大維數據的變數選擇方法,如大維情況下的AIC、BIC等來解決相應的問題。相關研究形成SCI論文共11篇,並獲得1項省級科研獎勵。這類問題在無線通訊和金融等各個領域中都有所套用。我們在論文中也初淺提到一些相關套用,未來希望可能致力於相關理論研究在無線通訊領域中的套用推廣,以問題為導向在套用中進一步推進理論研究。

熱門詞條

聯絡我們