相依區間刪失數據的統計分析

相依區間刪失數據的統計分析

《相依區間刪失數據的統計分析》是依託長春工業大學,由王純傑擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:相依區間刪失數據的統計分析
  • 項目類別:青年科學基金項目
  • 項目負責人:王純傑
  • 依託單位:長春工業大學
項目摘要,結題摘要,

項目摘要

近些年來區間刪失問題成為生存分析中研究的熱點問題,在失效時間變數和刪失變數獨立的假定下,統計學家給出了比較系統的研究成果,然而在實際套用中,經常會遇到失效時間變數和刪失變數不滿足獨立性假定的問題,即失效時間變數和刪失變數之間存在相關性(相依刪失)。本課題旨在考慮這類相依刪失(信息刪失)問題,即利用Copula理論的相關知識探索相依刪失數據類型下統計推斷問題,分別討論區間刪失I型數據即現狀數據下和區間刪失II型數據下的基於Copula理論的生存函式的各種非參數估計方法和帶有協變數影響因素下的回歸分析的統計推斷;建立基於經驗似然的相依區間刪失的統計推斷;研究將Copula模型和Frailty模型相結合解決相依區間刪失問題。本項目的預期成果將會進一步推動生存分析中相依刪失數據統計建模的發展,還將為生物醫學等領域提供理論支持.

結題摘要

本項目按照任務書中工作安排,有條不紊的開展了研究,取得了一系列的研究成果,很好的完成了各項研究內容。具體如下:針對相依區間刪失數據建模問題,基於Copula模型給出了感興趣的失效時間變數的生存函式的非參數估計,通過大量模擬研究驗證模型方法的有效性;利用經驗似然方法有效解決相依區間刪失數據回歸模型的統計推斷問題。針對誘導相依刪失醫療費用數據的統計建模問題,首先給出了基於線性變換模型下MLE估計和貝葉斯估計的統計推斷問題;其次給出基於失效時間變數和刪失醫療費用數據的誘導相依刪失關係,利用變換模型給出其回歸分析的統計推斷問題,並做了大量的模擬研究驗證了模型方法的有效性,並給出了其大樣本性質的證明。針對AH模型下現狀數據的貝葉斯自適應LASSO的變數選擇問題,我們套用快速MCMC算法來完成貝葉斯自適應Lasso方法。並且通過大量模擬驗證了模型方法的有效性,並且套用到香港II型糖尿病併發症-心臟病風險影響因素的數據分析中。針對逐步I型區間刪失數據的建模問題,基於廣義混合指數分布,利用極大似然估計和EM算法相結合有效地解決了複雜的數據結構和混合廣義指數分布族會帶來似然函數裡的超多參數的估計問題,通過大量的模擬研究驗證了模型估計方法的有效性,並將此模型套用於分析374名患有惡性疾病數據,進一步給出了其患病後存活的生存分布。針對潛變數模型的區間刪失I型數據及多元區間刪失I型數據建模問題,解決了加性風險模型的聯合建模問題,此模型方法的優勢在於引入潛變數,可以解決很多很難直接觀測到的數據,進而使用替代變數,從中提取有效因子,盡而更直觀的分析對感興趣變數的回歸影響。模型設定了不同的環境進行了大量的模擬,進一步驗證了帶潛變數的區間刪失I型數據的聯合回歸建模方法的有效性,並將此方法套用於香港糖尿病併發症的數據分析中。本項目基於相依區間刪失數據所得的研究結果可以更好的套用於臨床醫療、公共健康、醫療保險等套用領域。

相關詞條

熱門詞條

聯絡我們