對具有複雜自相關結構的兩類數據的統計推斷

《對具有複雜自相關結構的兩類數據的統計推斷》是依託中國科學技術大學,由郭瀟擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:對具有複雜自相關結構的兩類數據的統計推斷
  • 項目類別:青年科學基金項目
  • 項目負責人:郭瀟
  • 依託單位:中國科學技術大學
中文摘要,結題摘要,

中文摘要

本項目將對兩類具有複雜自相關結構的數據進行統計推斷:功能性核磁共振成像(fMRI)數據和分層自相關的生物數據,並重點研究統計推斷過程中遇到的高維自協方差矩陣的估計問題。上述兩種數據的特點為沒有重複觀測值且自相關結構複雜:fMRI數據的誤差項為非平穩時間序列,分層自相關的生物數據的自相關結構與物種進化樹結構有關。在對這兩種數據進行統計推斷的過程中,估計誤差項的自協方差矩陣非常重要,而現有的估計方法對這兩類數據並不適用。本項目擬研究高維自協方差矩陣的估計方法並對這兩種有代表性的數據做出統計推斷。具體的研究內容包括:(1)研究fMRI數據在半參數模型下的統計推斷,在非平穩時間序列假設下解決誤差自相關性問題。(2)研究具有樹狀自相關結構的生物數據線上性模型下的統計推斷,重點對誤差項的自協方差矩陣進行估計,獲得矩陣估計的收斂速度,進而論證該估計的最優收斂速度。

結題摘要

隨著高性能計算機的大量普及,收集、存儲高維數據變得成本低廉、操作方便,針對高維數據的分析也越來越重要。同時高維數據也對傳統的統計方法提出了難題和挑戰。該項目主要針對高維數據研究了以下問題:1.高維協方差矩陣及其逆矩陣的估計,以及半參數模型誤差協方差矩陣的估計在腦圖像(fMRI)數據中的套用,2.高維一般線性模型的穩健估計與推斷的穩健性質,如影響函式(influence function)與breakdown point。具體的,我們提出了帶有L1範數懲罰和條件數限制的高維協方差矩陣及逆矩陣的估計,並論證了估計的相合性,進而提出了數據驅動的調和參數的選擇方法;針對fMRI數據,在半參數模型下,我們提出了誤差項為非平穩時間序列的協方差矩陣的估計,並結合局部線性方法對參數部分做了假設檢驗,進而論證了檢驗統計量的漸進卡方分布;針對一般線性模型,我們研究了穩健的M估計以及穩健的Wald檢驗,論證了在數據受到污染的情況下檢驗統計量的漸進水平和功效依然在理論值的附近;對高維邏輯回歸模型,我們計算了帶有懲罰的極大似然估計的breakdown point。上述研究工作的重要意義在於,在方法上對高維協方差矩陣的研究提供了有效的技術工具,提高了協方差矩陣及逆矩陣估計在有限樣本下的表現;在套用上對fMRI數據的分析提供了更精確的方法,避免了由於模型識別錯誤帶來的誤差;在理論上分析了現有的一般線性模型中穩健估計和檢驗方法的穩健性質,對這些穩健方法的有效性提供了理論支持。這些工作對高維數據的研究進行了一定的完善和補充,在理論和套用上具有一定的貢獻。

相關詞條

熱門詞條

聯絡我們