縱向數據線性混合效應模型的統計推斷及其變數選擇

縱向數據線性混合效應模型的統計推斷及其變數選擇

《縱向數據線性混合效應模型的統計推斷及其變數選擇》是依託北京工業大學,由吳密霞擔任項目負責人的面上項目。

基本介紹

  • 中文名:縱向數據線性混合效應模型的統計推斷及其變數選擇
  • 項目類別:面上項目
  • 項目負責人:吳密霞
  • 依託單位:北京工業大學
項目摘要,結題摘要,

項目摘要

近年來,縱向數據分析是統計學的熱點研究課題之一,其成果已被廣泛地套用於生物、醫學、社會科學等研究領域. 在分析縱向數據時,實際工作者廣泛採用的一類重要統計模型為線性混合效應模型, 目前文獻中對該模型的研究已取得了許多重要成果.在該模型下參數估計的最優性理論, 廣義p-值檢驗的構造以及基於似然方法的大樣本理論等方面獲得了突破性進展和完善. 但關於該模型下的變數選擇、預測以及數據有缺失、維數超過樣本量情形的相關統計推斷等問題的研究,還處於剛剛起步階段. 如果忽視縱向數據的特點, 直接套用線性模型下相應的成果來分析縱向數據,則效率往往比較低, 甚至會得出錯誤的結論.本項目將在我們過去研究的基礎上, 研究線性混合效應模型的變數選擇、預測,以及缺失數據和高維數據情形下的該模型的統計推斷問題. 這些成果不僅具有重要的理論意義, 而且也將為套用領域的數據分祖達應析提供有效的實用工具.

結題摘要

縱向數據分析是當前統計學的熱點研究課題之一。線性混合效應模型是用來分析縱向數據的一類重要統計模型。目前文獻中對該模型的研究已取得了許多重要成果,如參數估計的最優性理論, 廣義p-值檢驗的構造以及基於似然方法的大樣本理論等方面獲得了突破性進展和完善. 但關於該模型的模型診斷,變數選擇、預測等問題以及數據存在缺失情形或高維情形的相關問題的研究還處於剛剛起步階段。本課題研究了縱向數據下線性混合效應模型參數的統計推斷、變數選擇、以及預測問題。主要成果有:比較了一般混合效應模型下方差分量模型兩種常見的無偏估計(方差分析估計和譜分解估計),揭示了它們間存在的函式關係,並給出了兩者等價的條件和彼此優於對方的條件,為兩估計的使用提供了選擇依據, 還給出了異方差情形下bootstrap檢驗;研究了帶非正態誤差的縱向數據混合效應模型的統計推斷,提出了小樣本精確檢驗存在的條件以及相應的檢驗;為生物指標診斷的靈敏性和特異性線性組合精度的檢驗提出了一種小樣本確定樣本量的方法,並考慮了其在帶測量誤差情形下的相關推斷;奔滲漏借鑑變換模型和悼重協燥高維數據線性模型結果,給出了高維數據下混合效應模型的一種簡單的變數選擇方法;給出了一種簡單有效的缺失數據下對稱分布均值的檢驗方法,並將其推廣到對數常態分配情形;小樣本推斷往往涉及到了約束邊界最優解問題,本課題採用數值方法尋找最優解, 提出了有效收斂的數值算法;為了將統計研究新成果和基本方法更好地服務於套用,課題負責人棕熱匪出版了專著《線性混合效應模型引論》和《多元統計分析》(皆由科學出版社出版),參編了專著《現代醫學統計》中關於縱向數據分析的部分。此外課題組還出版了教材《實用數據分析與MATLAB軟市店件》。這些成果不僅在理論上豐富了縱向數據混合效應模型的統計推斷方法,而且為套用領域提供了更為有效的、實用的數據分析工具。 該課題資助期間,課題組共完成科研論文21篇, 其元鍵組台中15篇已正式發表(12篇SCI檢索, 3篇核心期刊), 出版專著2部,教材射院寒1部,參編專著1部(中、英兩版)。

相關詞條

熱門詞條

聯絡我們