生物醫學數據統計分析的方法、理論與套用

生物醫學數據統計分析的方法、理論與套用

《生物醫學數據統計分析的方法、理論與套用》是依託中國科學院數學與系統科學研究院,由王啟華擔任項目負責人的重點項目。

基本介紹

  • 中文名:生物醫學數據統計分析的方法、理論與套用
  • 項目類別:重點項目
  • 項目負責人:王啟華
  • 依託單位:中國科學院數學與系統科學研究院
項目摘要,結題摘要,

項目摘要

本項目研究生物醫學數據包含高維或超高維數據、函式型數據、縱向數據、缺失數據及隨機刪失數據統計分析的方法、理論與套用,開展統計學與生物醫學交叉研究。具體地,我們探討生物醫學一些重要問題中因果路徑上多變數之間的因果作用的可識別性與傳遞性以及主分層的因果作用的統計推斷方法;研究複雜生物數據的模型選擇和模型平均方法,建立最優模型平均估計的理論;研究複雜生物試驗最優設計與數據質量監控技術;發展變數選擇方法、模型選擇方法及降維技術分析處理生物、醫學研究中高維數據及複雜高維數據;發展模型探測技術,研究函式多項式模型,使用奇異分解方法研究函式型數據的分析方法,使用相對誤差準則發展函式乘積模型的統計推斷方法與模型選擇方法;基於一些半參數模型研究隨機刪失下縱向數據統計分析的方法。

結題摘要

本項目研究生物數據包含高維或超高維數據、函式型數據、縱向數據、缺失數據及隨機刪失數據統計分析的方法、理論與套用,開展統計學與生物醫學的交叉研究。具體地我們提出了生物醫學問題研究中多個替代指標的判斷準則,避免“替代悖論”,探索直接間接作用的識別性和直接間接作用的界,研究治療對不同患者有不同的療效的因果作用異質性的上下界, 論證了非隨機缺失數據機制下常態分配和混合常態分配中參數的可識別性,提出了利用工具變數的方法進行主分層因果作用的評價,研究了各種關聯度量的可傳遞性,提出了發現和確定目標變數的原因和結果的局部因果網路學習的方法;提出了回響變數缺失時不依賴模型的變數篩選方法,這一方法使得任何全數據下的變數篩選方法均可套用到回響變數缺失的情形;對異方差部分線性單指標模型,發展了估計方程方法使之能用於變數選擇並同時定義半參數有效估計,所定義的估計被證明具有Oracle性質和有效性;在回響變數缺失時,發展了一種三步估計方法,定義了單指標參數及非參數函式的估計,所提出的估計均被證明是漸近正態的; 對函式多項式模型,我們發展模型探測方法識別出哪些階重要,哪些階不重要,從而識別出真模型並且使得模型有好的預報行為,提出了隨機分割模型平均方法獲得高維線性模型的平穩預報;對廣義線性模型和廣義線性混合效應模型,基於 Kullback-Leibler 損失提出了頻率模型平均估計中權重的選擇準則,並在理論上證明了其漸近最優性,從而將主要適用於連續觀測數據的最優模型平均理論拓展到了離散分類數據情形;對縱向數據、時間序列數據的模型平均方法研究,提出了刪組交叉驗證準則選取模型平均估計量中的權重,並證明了其理論最優性,從而解決了組內相關和序列相關給實施模型平均方法帶來的困擾;研究了幾類複雜生物醫學試驗和計算機仿真試驗的最優設計問題,針對存在緊鄰效應和邊際效應的一般干擾模型,給出了一致最優設計的等價性定理,系統解決了干擾模型下最優設計的刻畫問題;提出了序貫計算機仿真試驗中跟隨試驗的最優設計方法,從理論上證明了這些設計的抽樣性質和中心極限定理,解決了個性化醫療試驗中劑量回響模型的最優設計的特徵刻畫,給出了有效的搜尋算法。

相關詞條

熱門詞條

聯絡我們