《多因素複雜疾病微陣列數據富集分析方法研究》是依託中國人民解放軍第四軍醫大學,由陳長生擔任項目負責人的面上項目。
基本介紹
- 中文名:多因素複雜疾病微陣列數據富集分析方法研究
- 項目類別:面上項目
- 項目負責人:陳長生
- 依託單位:中國人民解放軍第四軍醫大學
中文摘要,結題摘要,
中文摘要
微陣列技術可同時獲得大量基因的表達譜,已廣泛套用於多因素複雜疾病研究。微陣列數據分析方法的研究已成為衛生與醫學統計學、數據分析方法學研究領域的重要任務和熱點問題,但目前尚缺乏此類數據分析方法的完整體系及分析軟體。本項目擬在總結評價現有單基因分析方法的基礎上,構造混合效應模型單基因分析檢驗統計量,定義新的富集得分;並考慮多基因、社會心理等因素及其相關性在複雜疾病發生中的效應,建立潛變數分析與混合效應模型相結合的潛變數混合效應模型,基於該模型,提出新的多因素複雜疾病微陣列數據富集分析方法;並利用模擬實驗和實例數據驗證該富集分析方法的特性和檢驗效能。本項目的開展可充分挖掘微陣列數據中差異表達信息,深層次研究複雜疾病的基因功能;並可為多因素複雜疾病的預防、診斷、治療和發病機制的研究提供重要線索,為後基因組學中功能基因表達研究提供統計分析方法支持,具有明確的針對性和實用價值。
結題摘要
微陣列技術可同時獲得大量基因的表達譜,已廣泛套用於多因素複雜疾病研究。基因表達水平間往往存在相關性,其分布未知,而且基因表達水平與其複雜的影響因素間的具體依存關係不明確,往往表現為複雜的非線性關係;另外,微陣列數據具有高維、樣本量小、多層次和關係複雜的特點,因而不滿足一般統計分析方法所要求的前提條件。如果仍用一般方法進行統計推斷,則結論的可靠性將會受到不同程度的削弱,甚至出現錯誤的分析結論。因此,有必要對多因素複雜疾病微陣列數據統計分析方法進行發展。本項目用Monte Carlo法比較評價微陣列數據的單基因分析方法,將基因間相關性從不同角度納入模擬實驗數據進行基因集分析方法檢驗效能的比較,模擬實驗和實例分析結果表明基於模型構建的基因集分析方法有效考慮了基因間的相關性。構建微陣列數據單基因分析混合效應模型檢驗統計量及其常用協方差陣結構,定義基因富集得分。採用主成分分析對基因集構建潛變數,建立潛變數混合效應模型,提出基於潛變數混合效應模型的微陣列數據富集分析方法,用模擬實驗和臨床實例數據驗證其特性與檢驗效能,並與其他方法進行比較,分析結果表明結合已知的生物學知識和證據,基於混合效應模型的基因富集分析方法比其他方法更容易發現較多的有生物學意義的相關通路,具有較高的篩選率、靈敏度。本項目富集分析方法克服了傳統模型的局限性,可分析具有複雜關係的非獨立數據,不僅考慮了基因間的相關性,而且更有效地將微陣列數據信息與外部基因相關知識相結合。因此,本研究對於充實和完善現有的微陣列數據富集分析方法,充分利用微陣列實驗的海量基因信息,深層次研究基因功能具有重要意義。