全基因組關聯分析基因互動作用探測算法研究

全基因組關聯分析基因互動作用探測算法研究

《全基因組關聯分析基因互動作用探測算法研究》是依託湖南師範大學,由謝民主擔任項目負責人的面上項目。

基本介紹

  • 中文名:全基因組關聯分析基因互動作用探測算法研究
  • 項目類別:面上項目
  • 項目負責人:謝民主
  • 依託單位:湖南師範大學
項目摘要,結題摘要,

項目摘要

受計算資源和算法效率的制約,作為探索複雜疾病遺傳機制有力手段的全基因組關聯分析(GWAS)目前主要局限於單位點分析方法。可複雜疾病是基因-基因、基因-環境互動作用的結果,全基因組關聯分析亟需高效多位點互動作用探測算法。 人類大部分DNA以前被誤認為是垃圾,GWAS採用的基因型數據大部分是在垃圾DNA上,其隱藏的功能信息沒能利用。最近ENCODE計畫已發現人類DNA80%的序列至少參與某一生化功能,屬於某一功能元素。本項目將把SNP位點映射到DNA功能元素,把以SNP為單位的基因型數據轉換成以功能元素為單位的數據,通過聚集基因調控網路、代謝路徑和蛋白質互動網路等信息,把功能元素進行分區;進而挖掘變換後數據的小參數特性,利用聚類、邏輯回歸、決策樹等手段結合參數複雜理論為互動作用建模;最終基於分區搜尋策略,採用參數算法設計技術和機器學習方法為GWAS設計實用高效的多位點互動作用探測算法。

結題摘要

受計算資源和算法效率的制約,作為探索複雜疾病遺傳機制有力手段的全基因組關聯分析(GWAS)目前主要局限於單位點分析,可複雜疾病是基因-基因、基因-環境互動作用的結果,設計有效的全基因組多基因互動作用探測算法對揭示複雜疾病發病機制有重要意義,全基因組關聯分析亟需高效多位點互動作用探測算法。在本項目的資助下,我們提出了基於能量分布差異的多個SNP位點相互作用探測算法。該方法將每個個體的SNP序列對應到高維空間中的一個點,這些點都攜帶相同大小的能量;然後尋找一個新的坐標系,使得疾病人群與健康人群的能量分布差異達到最大;進而根據這個新坐標系找到有互動作用的多位點的SNP的組合。進而我們通過融合蛋白質互作信息和蛋白質在亞細胞中的位置信息構建加權互動圖,通過疊代方法給候選的致病基因排序,並能有效發現新的候選致病基因。 同時項目組在生物網路構建、基因組序列變異數據糾錯、基因組變異的單體型分型研究上也取得了顯著進展,我們利用平衡最佳化分區和兩位點連鎖加權圖構建了單體型重建的有效算法,為進一步研究基於單體型的全基因組關聯分析多基因互動作用探測算法研究打下了基礎。

相關詞條

熱門詞條

聯絡我們