高維稀疏統計模型中的變數選擇與檢驗

高維稀疏統計模型中的變數選擇與檢驗

《高維稀疏統計模型中的變數選擇與檢驗》是依託首都師範大學,由崔恆建擔任項目負責人的面上項目。

基本介紹

  • 中文名:高維稀疏統計模型中的變數選擇與檢驗
  • 項目類別:面上項目
  • 項目負責人:崔恆建
  • 依託單位:首都師範大學
項目摘要,結題摘要,

項目摘要

關於高維數據的變數選擇方法目前還處在變數的選擇與估計階段,而缺乏統計檢驗功能,對於高維稀疏數據模型下的統計檢驗以及超高維數據下的快速變數降維方法也甚少。本項目擬在這兩個統計學基礎課題上開展深入研究,並有望取得突破性成果。具體我們將在帶有附加信息的高維高維稀疏數據的變數選擇方法上提出既能選擇與估計,同時又能進行統計檢驗的新方法;提出高維稀疏數據的聚類降維新理論和技術;提出超高維稀疏數據下的掃描的新理論和方法。這些新的高維複雜數據的分析方法可套用於CT檢測成像,GWAS等數據分析中去、為信息技術、生物醫學等研究領域提供先進的數據分析方法,豐富高維複雜數據的統計理論和分析方法。

結題摘要

本項目針對項目任務書中的研究內容逐一開展研究並圓滿完成既定任務。對於(超)高維線性模型、部分線性模型以及廣義線性模型等幾類重要的帶有模型信息高維稀疏數據類型,我們獲得了如下重要成果:對於高維部分線性回歸模型,基於F-統計量的思想提出了檢驗回歸係數的廣義F-檢驗統計量,獲得了廣義F-檢驗的優良性質;對於稀疏情形下的變數選擇和參數假設檢驗問題,提出了新的部分懲罰經驗似然比檢驗方法,做到在變數選擇的同時又能進行假設檢驗,並建立了優良的統計理論性質;對於部分回歸係數檢驗問題,我們基於二階糾偏U統計量和交叉驗證方差估計的方法提出了關於它的檢驗以及穩健檢驗新方法,顯著提高了檢驗功效。對於帶有聚類或類別變數的超高維稀疏數據分析,我們提出了新的模型自由的均值-方差(MV)掃描的新技術方法和理論;對於聚類降維的超高維的單指標模型,我們提出了懲罰的分位數回歸和獨立的穩健變數掃描新方法,獲得了諸多優良的統計理論性質。對於一類重要的高維稀疏結構特徵高維協方差陣的線性結構的檢驗問題,我們提出了基於LS參數估計、熵距離以及二次距離的新檢驗技術方法,獲得了優良的統計理論性質。對於高維因子稀疏結構模型中的高維協方差陣,以及高維稀疏線性模型中誤差分布的估計等問題,我們提出了基於分樣本技術和變數選擇方法獲得新的檢驗和估計方法,並得到了優良的統計理論性質。對於半函式型線性模型,我們利用函式型係數和光滑函式的樣條逼近方法,給出了該模型下的SIEVE M-估計,獲得了估計優良理論性質。解決了可變分組數卡方檢驗的相合性基本理論問題,並給出了檢驗統計量和相應的卡方隨機變數的K-S距離的收斂速率。這些新的高維複雜數據的分析方法已套用於CT檢測成像降噪,金融數據模型分析、GWAS、癌症等數據分析中去,得到了良好的效果,豐富了高維複雜數據的統計理論和分析方法,其成果大部分已經發表在統計權威期刊雜誌上。

相關詞條

熱門詞條

聯絡我們