加速失效時間模型中GCC抽樣的統計推斷及最優設計研究

加速失效時間模型中GCC抽樣的統計推斷及最優設計研究

《加速失效時間模型中GCC抽樣的統計推斷及最優設計研究》是依託中南財經政法大學,由楊青龍擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:加速失效時間模型中GCC抽樣的統計推斷及最優設計研究
  • 項目類別:青年科學基金項目
  • 項目負責人:楊青龍
  • 依託單位:中南財經政法大學
項目摘要,結題摘要,

項目摘要

在流行病研究中,常需要考察協變數對生存時間的影響。加速失效時間模型直接建立對數生存時間與協變數之間的線性回歸關係,具有很強的解釋性。在大型佇列研究中,由於預算限制或技術難題,協變數無法對所有個體進行測量。可通過選取一種有效的抽樣方法來抽取子樣本觀測協變數以提高研究效率。病例佇列抽樣只抽取一個簡單隨機樣本和所有病例,在大型佇列的罕見病研究中引起了極大關注。然而,當發病率較高時,使用廣義病例佇列研究,只抽取部分病例。刪失和抽樣有偏性給加速失效模型中GCC抽樣的統計推斷帶來巨大挑戰。基於傳統統計方法所得估計方程有偏和不連續的。本項目擬在該問題上開展一些原創性的研究。該項目提出加權修正估計方程方法,採用光滑逼近和核光滑技術,利用經驗過程理論,建立一系列加速失效時間模型的統計推斷方法,並探索GCC抽樣的最優設計問題。通過豐富的計算機模擬闡明所提出方法的實用性,並將之套用於一項正在進行的肺癌研究中。

結題摘要

在大型流行病學研究中,研究節約成本提高效率的抽樣設計並建立相應的統計推斷方法顯得非常重要。廣義病例佇列設計(GCC)是一種在實際中廣泛套用的節約成本提高效率的抽樣設計方法,其在了解暴露因素對人類複雜疾病的影響有著深遠的意義。本項目在廣義病例佇列設計(GCC)下,首先在加法風險模型的框架下,建立了未知回歸參數的統計推斷方法,並建立了估計量的大樣本性質,模擬結果表明我們的方法可行。其次,在加速失效模型下,採用誘導光滑的方法建立了光滑的加權的Gehan估計方程來估計待估參數,建立了估計量的大樣本性質,此外考慮了GCC設計的最優性。然後,建立了一類半參數轉換速率模型來研究復發時間,通過估計方程的方法來估計未知的參數,並建立了相應估計量的相合性和漸近正態性。最後,通過邊際分布危險率服從一般的危險模型來研究多元失效時間,通過估計方程的方法來估計未知參數,並給出共同的累積基準危險率函式的一個相合估計。此外,綜合考慮企業的財務和非財務因素,利用 LASSO方法對企業財務困境預測指標進行篩選,然後使用決策樹、隨機森林、 SVM、最近鄰法這四種數據挖掘方法,以及常見的 logistic模型,分別建立企業財務困境預測模型。在相關問題的研究中,大部分都運用模擬結果表明我們方法的優良性, 同時將其運用到實際數據中。此項目研究結果既有重要的理論意義又有廣泛的套用前景。
check!

熱門詞條

聯絡我們