複雜疾病關聯分析中高維遺傳數據的統計推斷

複雜疾病關聯分析中高維遺傳數據的統計推斷

《複雜疾病關聯分析中高維遺傳數據的統計推斷》是依託東北師範大學,由朱文聖擔任項目負責人的面上項目。

基本介紹

  • 中文名:複雜疾病關聯分析中高維遺傳數據的統計推斷
  • 項目類別:面上項目
  • 項目負責人:朱文聖
  • 依託單位:東北師範大學
項目摘要,結題摘要,

項目摘要

人類的健康面臨許多複雜疾病的威脅。定位複雜疾病的致病基因,探究複雜疾病的遺傳規律一直以來都是人們關心和期待解決的問題。基於人類基因組上的多態性位點遺傳數據,統計學家利用關聯分析研究幫助和指導遺傳學家進行實驗研究。生物技術的不斷革新,使得遺傳數據的類型也在發生著不斷的變化。最新研究指出,人類複雜疾病受著很多個突變率極低、傳統技術很難檢測的罕見變異位點的共同調控。近幾年產生的下一代高通量測序技術為我們提供了海量的高維罕見變異遺傳數據。新型遺傳數據的高維性及罕見變異性給傳統的統計方法提出了新的挑戰。本項目以高維遺傳數據及複雜疾病關聯分析中期待解決的問題為驅動,已現有的統計理論與方法為基礎,以實際套用為目的,建立適用於高維遺傳數據關聯分析的統計方法,研究遺傳變異位點與疾病變數之間的統計相關性,尋找與疾病高度相關的多態性位點,為遺傳學家進一步的實驗研究提供理論基礎和依據。

結題摘要

人類的健康受到許多複雜疾病的威脅。越來越多的研究表明這些常見的複雜疾病都與遺傳有關。利用統計學方法分析遺傳數據進而定位與複雜疾病統計相關的疑似位點一直以來都是人們關心的問題。高通量測序技術的革新為我們提供了信息量更高的新型遺傳數據,其主要特點是維數高、等位基因突變率低,通常稱之為高維罕見變異遺傳數據。新型的遺傳數據給傳統的統計方法提出了挑戰。本項目以複雜疾病基因定位研究中期待解決的問題為驅動,以高維罕見變異遺傳數據的統計分析為目的,致力於構建新的統計模型與算法,並把其套用到實際數據分析中。我們具體研究了三部分內容:1)不同類型疾病變數與高維遺傳位點間關聯分析的相依多重檢驗方法;2)罕見變異位點關聯分析的統計建模及在高維數據分析中的套用;3)多維疾病變數與高維遺傳數據的統計分析方法。針對不同的研究內容,我們提出了一些新的統計方法與模型:基因組關聯分析以及調整環境協變數影響的相依多重檢驗方法;基於代數統計的罕見變異關聯分析方法;罕見變異關聯分析的非參數方法;多維疾病變數與罕見變異位點間關聯分析的非參數統計方法。此外,我們還研究了忽略抽樣機制對醫學圖像全基因組關聯分析的影響,給出了基因表達水平數據的統計建模以及基因定位的連鎖分析統計方法。根據這些研究成果,我們撰寫了一系列高質量的學術論文,除了幾篇正在審稿的論文之外,大部分的論文已經正式發表。新的統計方法不僅具有一定的理論研究價值,還具有很強的套用前景,可以被廣泛套用到高維遺傳數據的統計分析中,指導實際工作者在實驗之前有目的地挑選一些疑似的致病位點。本項目的完成不僅會推動統計學本身以及其在高維遺傳數據分析中的發展,還對人類複雜疾病的治療與預防有著非常重要的實際意義。

相關詞條

熱門詞條

聯絡我們