基於多層次數據整合的複雜疾病遺傳關聯分析方法研究

基於多層次數據整合的複雜疾病遺傳關聯分析方法研究

《基於多層次數據整合的複雜疾病遺傳關聯分析方法研究》是依託西南大學,由王峻擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於多層次數據整合的複雜疾病遺傳關聯分析方法研究
  • 項目類別:面上項目
  • 項目負責人:王峻
  • 依託單位:西南大學
項目摘要,結題摘要,

項目摘要

複雜疾病發生髮育是多種遺傳因素共同作用的結果。對不同遺傳層次產生的組學數據中包含的關鍵特徵及它們間關聯模式的挖掘能夠指導複雜疾病的分析和治療。針對現有方法容易受噪聲影響,對跨層次遺傳互作效應缺乏有效利用等問題,本項目研究基於多層次數據整合的遺傳關聯分析方法。首先針對高維基因組序列數據設計多分類器混合集成方法,獲取序列層面的關鍵特徵位點集合;在表達數據上設計雙聚類集成策略識別疾病關聯共表達模組,提取表達層面關鍵信息;最後,整合不同層次不同類型的遺傳特徵構建多層次異構遺傳關聯特徵網路,並設計基於組塊化三元隨機遊走的信息傳播模型,通過網路中各層次間信息的動態互補準確挖掘複雜疾病的遺傳關聯模式。本項目研究能深化並拓展面向生物大數據分析的機器學習理論與套用研究,在複雜疾病遺傳分析和輔助治療等方面也具有套用價值。

結題摘要

複雜疾病發生髮育是多種遺傳因素共同作用的結果。對不同遺傳層次產生的組學數據中包含的關鍵特徵及它們間關聯模式的挖掘能夠指導複雜疾病的分析和治療。針對現有方法容易受噪聲影響,對跨層次遺傳互作效應缺乏有效利用等問題,本項目研究基於多層次數據整合的遺傳關聯分析方法。項目研究中(1)針對高維基因組序列數據設計了基於篩選-搜尋的兩階段高階SNP互作位點識別方法,並在此基礎上提出了基於多分類器混合集成的計算方法,提高了序列層面的關鍵特徵位點集合的識別精度和效率;(2)在轉錄層面的表達譜和RNA-Seq數據上設計基於整合多/雙聚類和多視圖多雙聚類的疾病關聯共表達模組識別方法,提高了共表達模組的識別精度,並套用到癌症亞型的分類套用中;(3)提出了蛋白質負樣例構建策略和基於深度學習的蛋白質及其亞型相互作用網路預測方法,增加了現有遺傳網路的信息含量,並基於現有遺傳特徵網路,提出了多種基於標籤傳播策略的蛋白質功能預測方法,極大地提升了複合特徵網路的信息覆蓋度;(4)通過多層次異構遺傳關聯特徵網路整合不同層次不同類型的遺傳特徵,通過網路中各層次間信息的動態互補,提出了多種基於遺傳信息整合的疾病關聯協同驅動通路識別方法和lncRNA-疾病關聯預測方法,提高了複雜疾病的遺傳關聯模式的識別精度;(5)項目還在多模態哈希學習和多視圖學習領域進行了擴展研究,提出了多種面向大規模哈希檢索的計算策略和多視圖多示例多標記學習方法,推動了機器學習理論的研究。本項目研究深化並拓展面向生物大數據分析的機器學習理論與套用研究,在複雜疾病遺傳分析和輔助治療等方面也具有良好的套用價值。

相關詞條

熱門詞條

聯絡我們