高維數據分析中的收縮估計與似然推斷

《高維數據分析中的收縮估計與似然推斷》是依託蘭州大學,由李周平擔任項目負責人的面上項目。

基本介紹

  • 中文名:高維數據分析中的收縮估計與似然推斷
  • 依託單位:蘭州大學
  • 項目負責人:李周平
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

高維數據分析與建模是目前統計及相關領域研究的熱點。本項目擬結合收縮估計和似然推斷兩方面研究高維數據的統計分析。對於前者,我們將基於Stein無偏風險估計 (SURE) 與經驗貝葉斯的思想,構建異方差多元正態模型在分量相依、存在協變數、稀疏以及非均方誤差準則下高維均值向量的收縮估計,在一定條件下獲得估計的最優性和漸近性質;對於後者,本項目將綜合套用懲罰經驗似然與刀切法,提出高維懲罰刀切經驗似然法,研究基於U-統計量結構估計方程、典型相關分析、Z-估計和廣義相對誤差準則下的變數選擇和推斷問題,將證明所提方法的極限性質。同時,本項目將通過模擬研究對這些方法與已有方法進行比較,以展現所提方法的優勢。這些新方法將被套用於分析一些圖像、醫學、壓縮感測的實際數據。通過本項目研究,可望在理論上豐富SURE、經驗貝葉斯和經驗似然的研究,同時也拓寬其套用領域,為圖像處理、生物信息等領域提供更穩健、有效的方法。

結題摘要

高維數據的統計分析在生物、經濟、環境等領域有著廣泛的套用背景。本項目基於經驗貝葉斯、Stein無偏風險估計、經驗似然等方法,對高維數據中的同時估計與統計推斷問題展開了方法論的研究。我們研究了:異質(異源)一維正態總體的均值的大規模同時估計,在方差不同且未知的情形下,提出了雙收縮SURE估計;具有一般協方差結構的異質多維正態總體,建立了均值向量的同時估計;高維數據的聚類問題,提出了基於收縮估計和學習向量量化算法的增強K均值聚類法;結合SURE估計與線性分類器,提出了更準確的高維分類算法;異質Pareto總體中參數的同時估計,建立了風險參數的同時估計;廣義相對誤差估計理論,構建了乘法回歸模型中增維參數的經驗似然置信區間;構造了線性回歸模型中誤差項方差的刀切經驗似然置信區間;Lorenz占優的檢驗問題,提出了Lorenz曲線差值的刀切經驗似然推斷方法;構建了高維數據情形下,非光滑U-型估計函式中參數的置信區間;基於U-型估計方程的變數選擇和估計問題,提出了懲罰刀切經驗似然方法;考慮了選擇後推斷問題,建立了基於懲罰經驗似然的選擇後推斷方法。對以上估計和檢驗,我們證明了相應的漸近性質,進行了大量的模擬研究並套用於一些醫學研究、環境、保險等領域實際數據的分析。這些方法是對經驗貝葉斯、收縮估計理論和經驗似然方法的豐富和發展,也為生物、醫學、金融、經濟等領域的科學研究和實際套用提供了可靠的方法支持和理論指導。

相關詞條

熱門詞條

聯絡我們