基於拷貝數變異的疾病易感基因定位中的統計方法研究

《基於拷貝數變異的疾病易感基因定位中的統計方法研究》是依託復旦大學,由胡躍清擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於拷貝數變異的疾病易感基因定位中的統計方法研究
  • 依託單位:復旦大學
  • 項目類別:面上項目
  • 項目負責人:胡躍清
項目摘要,結題摘要,

項目摘要

基因拷貝數變異是近五年內受到高度關注的人類基因組的新一代多態性特徵,大多數科學家認為它跟生物的表現型和疾病的易感性有很大的關係,越來越多的研究結果表明了基因拷貝數變異跟人類常見複雜疾病有關聯,比如帕金森綜合症和愛滋病。本項目將著力研究:(1)基於一般家系基因拷貝數的關聯分析;(2)利用拷貝數信息進行簡單高效的親源效應檢驗;(3)個體特徵值拓展到質量性狀,數量性狀,分類或排序數據;(4)當基因型的缺失依賴於基因型時,利用條件似然檢驗親源效應;(5)利用比對法檢驗數據的缺失跟基因型是否獨立;(6)利用多位點信息進行具親源效應易感基因的定位研究;(7)直接利用基因晶片得到的原始強度值進行關聯分析和親源效應檢驗;(8)利用半參數貝葉斯方法估計基因拷貝數;(9)利用混合貝葉斯模型整合多個平台的高通量基因組數據。從而對人類複雜疾病易感基因的定位以及個性化的治療方案提供統計學上的理論根據。

結題摘要

變異是導致疾病的一個重要潛在因素,檢測變異發生的位置是疾病易感基因定位中的一項重要任務。常見的變異有基因拷貝數變異,單核苷酸多態性,DNA結構變異等。本項目發展了針對不同場合的系列檢測各種變異的統計學方法:(1)基於核心家系中的基因拷貝數信息構造非參數檢驗統計量;(2)充分利用一個家系中患病和健康小孩的基因型信息,雙親信息或單親信息,檢驗等位基因是否具有基因印記;(3)利用在家系內部或家系之間配對患病小孩及父母和健康小孩及父母,這裡的父或母的基因型信息可缺失,構建偏似然函式,繞過需要強假設條件的多餘參數,同時檢測母系效應和親源效應;(4)利用Kullback-Leibler度量衡量病例組和對照組中變異分布之間的差別,構建穩健的檢驗統計量,同時檢驗常見變異和罕見變異跟疾病的關聯,簡單易用,無任何參數的假設條件(5)對核心家係數據,利用父母中未傳給患病小孩的兩個等位基因形成健康對照組,比較健康組和病例組之間變異分布的差別來構建相應的檢驗統計量;(6)研究精神類疾病時常見分類屬性的性狀值,目前文獻中還沒有高效的方法可以用在位點數較多的場合,利用資訊理論中的互信息來度量多位點基因型和分類性狀值之間的依賴關係,從而可以有效地檢測出相關聯的變異位點;(7)融合位點之間連鎖不平衡信息以及重組率的信息進行病例對照組關聯分析研究(8)利用廣義Kendall檢驗統計量,進行基因或染色體區域與有序性狀值的關聯分析研究,以及多位點與多相關性狀的關聯分析研究。(9)基於單倍型分布差別的關聯分析研究。以上所有方法均通過大量的隨機模擬驗證,結果表明都能很好地控制住第一類錯誤,比起文獻中現有的方法有更高的檢驗功效。在實際數據分析中取得了好的效果,並形成相應的數據分析軟體包,方便實際工作者使用。

相關詞條

熱門詞條

聯絡我們