機率抽樣設計及其統計推斷方法

機率抽樣設計及其統計推斷方法

《機率抽樣設計及其統計推斷方法》是依託中國人民大學,由許王莉擔任項目負責人的面上項目。

基本介紹

  • 中文名:機率抽樣設計及其統計推斷方法
  • 項目類別:面上項目
  • 項目負責人:許王莉
  • 依託單位:中國人民大學
項目摘要,結題摘要,

項目摘要

在流行病學研究中,協變數對回響變數的影響往往是人們關心的問題之一。如果感興趣的協變數的數據獲取花費很多,在有限資金的情況下,如何獲取數據使得模型的估計更有效?Zhou, Xu, Zeng和Cai(2014)提出機率抽樣方法得到兩階段數據比目前常用的抽樣方法更有效。 本課題致力於研究關於機率抽樣方法的統計推斷問題. 在感興趣的協變數存在輔助變數的情況下,我們將考慮如何把輔助變數的信息用到機率抽樣和統計推斷中,充分利用數據的信息提高有效性。如果數據存在中心效應,本課題試圖用機率抽樣的方法在不同中心獲取數據,用混合效應模型做推斷。目前的機率抽樣是關於線性模型的統計推斷,半參數模型的機率抽樣設計也是本課題研究的問題之一。現有的關於兩階段抽樣數據的統計推斷都是模型估計,模型檢驗文獻中還沒有涉及到,關於模型的檢驗也是非常重要的.

結題摘要

大數據時代的到來,為統計學的發展提出了新的機遇和挑戰。現在的數據呈現了數據量龐大,數據產生迅速,數據關係複雜,數據缺失等特點,對傳統統計分析方法和理論提出了重大挑戰。 本課題致力於研究大數據背景下關於機率抽樣方法的統計推斷問題,機率抽樣獲取的數據屬於缺失數據的一類數據。該項目對於缺失數據,主要研究了基於該數據的模型估計和假設檢驗問題,以及在高維數據情況下的變數篩選問題。具體內容包括:高維數據假設檢驗中原假設個數的估計問題研究;高維均值假設檢驗問題,使得統計量無論在稀疏信號備擇假設和稠密信號備擇假設下,都具有很好的功效;研究了縱向數據中的廣義變係數模型,在稀疏超高維的情況下篩選變數方法;對於回響變數缺失的情況下,在高維變數的情況,通過降維結構,提出半參數估計方法估計回響變數的均值;在大數據的情況下,修正的Hosmer—Lemeshow檢驗;對於缺失數據的分析,提出基於矢量艾特肯(VA)方法的加速EM算法;在回響變數缺失的情況下,研究了半參數線性模型中半參數函式是否具有參數結構的假設檢驗問題; 以及對於高維數據,模型的基於充分降維的穩健估計方程。課題的研究不僅在實際問題中具有重要的意義,在理論研究中也有重大的挑戰。

相關詞條

熱門詞條

聯絡我們