《失效類型未知時生存數據的統計分析及其套用研究》是依託中國科學院大學,由孫志華擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:失效類型未知時生存數據的統計分析及其套用研究
- 項目類別:青年科學基金項目
- 項目負責人:孫志華
- 依託單位:中國科學院大學
項目摘要,結題摘要,
項目摘要
收集數據時,經常會發現生存數據的失效類型未知,即缺失了。在隨機缺失的假定下,關於生存數據的研究,相關文獻比較多。但隨機缺失的假定在實際中經常不成立,這時套用基於隨機缺失假定的方法會導致錯誤的統計分析結果。本項目擬在失效類型非隨機缺失的(即不可忽略的缺失)情況下,研究生存數據的估計和檢驗問題。數據不可忽略的缺失時的統計問題的解決非常困難,一般認為相關的生存時間的函式是不可識別的,從而是不可估的。本項目擬利用失效類型為離散變數的特點,利用機率拆分和擬似然估計方法估計出回響機率函式,在此基礎上對缺失機制進行檢驗,對生存函式和失效率函式給出非參數估計,並對半參數模型(COX模型和可加危險模型等)的估計和檢驗問題展開研究;並對一組生存樣本是否來自某一總體及兩組生存樣本的失效率函式是否有差異進行檢驗。本項目的研究在理論上有較大創新,研究成果可以套用於很多研究領域,具有比較重要的意義。
結題摘要
失效類型未知時生存數據的研究是一個重要的研究課題。本項目完成了如下工作: (1)在隨機右刪失條件下當失效類型不可忽略的缺失時研究了生存函式的調整的插補估計:首先提出擬似然方法估計參數機率模型中的參數,證明了參數估計的漸近正態性。在不可忽略的缺失機制下,一般的插補方法會導致一個偏差,對偏差進行矯正之後我們提出生存函式的一個調整的插補估計,證明了這個估計收斂到一個高斯過程,數值模擬研究了所提估計和文獻中所提的生存函式的平均積分二次誤差(MISE),在不可忽略的缺失機制下,所提的調整的插補估計具有比文獻中所提的估計更小的平均積分二次誤差(MISE);(2)對缺失機制是隨機缺失還是不可忽略的缺失的檢驗問題進行了研究:第一項工作表明在隨機缺失機制下,本項目第一項工作所提的生存函式的調整的插補估計的平均積分二次誤差(MISE)比文獻Wang等(2009)所提估計的效果稍微差一些。因此有必要驗證缺失機制是隨機缺失的還是不可忽略的缺失的。本項目的第二項工作對這個問題提出了基於經驗過程的檢驗方法。給出了檢驗統計量在零假設的分布,並用重抽樣方法給出檢驗的臨界值;並用數值模擬方法驗證了檢驗方法的經驗水平和經驗功效;(3)對乘積機率模型提出了基於經驗過程的檢驗方法:第一項工作中在估計未知參數時需要乘積機率模型是正確的,否則給出的參數的估計是有偏的。因此乘積機率模型的假定是否正確也是非常關鍵的。我們參考文獻中Dikta等(2006)估計參數模型的方法給出估計乘積機率模型的方法,給出檢驗統計量的漸近性質。(4)完成了隨機右刪失模型當刪失指示變數不可忽略的缺失時失效率函式的估計問題:對於失效率函式的估計,對C_C估計以及文獻中基於隨機缺失機制下提出的插補、回歸及逆機率加權估計進行校正和糾偏得到失效率函式的四個估計,研究估計的一致相合性和漸近正態性;(5)當刪失指示變數不可忽略的缺失時,提出了生存函式的一個改進的更加簡單有效的估計:第一項工作中提出了生存函式的調整的插補估計上標非常複雜,出現多個估計項。我們提出2個結構更加簡單的估計,因為不涉及過多的估計項,數值模擬結果很好。