基於多檢測理論融合的基因組結構變異綜合檢測方法

《基於多檢測理論融合的基因組結構變異綜合檢測方法》是依託北京化工大學,由高敬陽擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於多檢測理論融合的基因組結構變異綜合檢測方法
  • 依託單位:北京化工大學
  • 項目類別:面上項目
  • 項目負責人:高敬陽
項目摘要,結題摘要,

項目摘要

精準檢測基因組結構變異,對變異形成機制的研究、揭示人類基因變異與複雜疾病之間的關係非常重要。現有基於測序的結構變異檢測方法存在的問題是每種檢測方法均有不同的各自側重點,均依賴於結構變異的類型或者序列片段的特性,而且對各種檢測方法的評價沒有公認的金標準。本項目以現有的結構變異檢測方法深度分析為出發點,重點研究融合多種檢測理論的結構變異綜合表征和適應大樣本學習的高泛化性能複雜網路模型,突破特徵指標體系、特徵參數敏感性規律、學習訓練樣本集、基於爭議度的AdaBoost權值調整策略和神經網路逆向權值調整策略等關鍵技術,建立一套先進的基因組結構變異綜合檢測的理論與技術體系。本項目的研究結果將有利於對基因結構變異分類產生新的認識,在基因組水平進行大規模的結構變異發現、識別結構變異類型、建立人類的結構變異圖譜資源方面具有十分積極的意義。

結題摘要

本項目的研究目標是:融合多種檢測理論的綜合檢測策略,獲得高泛化性能的精準檢測模型。關鍵問題有兩個:科學問題一,基因組結構變異特徵提取與表達,形成變異綜合表征;科學問題二,適合基因測序數據檢測的高泛化性能複雜網路模型。在四年的項目執行期間,對這個兩個關鍵科學問題進行了充分的研究,取得了突破性的研究成果,較好地完成了既定目標。 針對科學問題一的研究工作:①基於仿真數據的缺失變異特徵挖掘研究;②基於真實數據的人類基因組缺失變異綜合表征研究並形成特徵指標體系。 取得的研究成果是:①根據RP、SR、RD三類檢測方法的基本原理,充分利用配對末端測序序列初次映射和二次分裂比對的兩次比對結果,分析並挖掘提取了16個與缺失變異相關的序列特徵;②基於真實數據的缺失變異綜合表征研究並形成特徵指標體系。基於雙末端測序片段映射分析、測序片段分裂比對和測序片段映射深度分布分析三種缺失變異檢測理論分別挖掘提取到了8、24和4個序列特徵,此外,對缺失變異區域及上下游區域的序列基本情況進行總結,挖掘提取了13個序列特徵。總計得到49個缺失變異的序列特徵,形成基因組缺失變異綜合表征指標體系。 針對第二個科學問題的研究工作:①基於AdaBoost算法的基因組缺失變異綜合檢測方法研究;②基於SVM模型的缺失變異檢測的研究,以及其他機器學習模型最近鄰KNN算法、隨機森林算法、GBDT疊代的決策樹算法、分類回歸樹算法等,對其檢測的有效性進行了驗證;③基於現今流行的深度學習卷積神經網路模型檢測缺失變異進行了研究等。 取得的研究成果是:基於仿真數據提出了一種將RP、SR、RD三類檢測理論和AdaBoost有機融合的基因組缺失變異綜合檢測策略;基於人類基因組真實數據提出的缺失變異集成檢測方法,給出了集成檢測的總體流程;基於現今流行的深度學習卷積神經網路模型檢測缺失變異已經取得了初步研究成果。

相關詞條

熱門詞條

聯絡我們