基於異構網路的致病基因及其複合物預測方法研究

基於異構網路的致病基因及其複合物預測方法研究

《基於異構網路的致病基因及其複合物預測方法研究》是依託大連理工大學,由徐博擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於異構網路的致病基因及其複合物預測方法研究
  • 依託單位:大連理工大學
  • 項目類別:青年科學基金項目
  • 項目負責人:徐博
項目摘要,結題摘要,

項目摘要

致病基因的預測問題是人類健康領域面臨的重大挑戰之一, 尋找致病基因及相關複合物是認識疾病發生機理、研製疾病基因診斷與防治的重要基礎。然而現有研究方法的性能受到蛋白質複合物信息有限、表型相似度計算依據不足、蛋白質關係中噪音數據的制約。因此本項目針對這三個方面的問題展開研究,設計基於多層網路模式轉換策略並融合豐富資源特徵的蛋白質關係網路重建算法,解決蛋白質關係中的噪音問題;提出基於屬性網路的複合物識別算法,將生物屬性與拓撲結構有機的結合從而提高複合物識別的性能;研究利用Skip-gram模型從海量未標生物醫學文獻中學習疾病表型的詞向量從而計算表型相似度;最後研究利用這三個結果組成異構網路進行致病基因及相關複合物的預測,從根本上提高預測的性能。所識別致病基因及複合物將為生物學家提供有力參考,同時所研究的網路構建算法對基於網路研究的藥物標靶發現等其他方面的相關研究具有一定的借鑑意義。

結題摘要

本項目組圍繞致病基因預測問題展開研究,並取得了一系列研究成果,發表期刊、會議論文13篇,其中第一作者的論文包括CCF b類高水平論文3篇,中科院二區論文3篇。具體研究成果:1、在關係抽取方面,針對信息更新延遲問題,我們提出融合用戶生成內容的深度學習方法,在F值方面取得了0.712。2、在複合物抽取方面,為了融合更多的生物證據我們提出融合基因本體信息的屬性圖嵌入算法用於複合物識別,實驗結果表明我們的方法取得了較好的性能。3、在致病基因預測方面,我們提出基於多路徑的隨機遊走圖嵌入算法,每個蛋白質向量與表型向量通過相似度計算獲得可能的致病基因。通過去一法驗證取得了較高的性能。項目的研究成果為關係抽取、複合物抽取研究、致病基因預測等研究提供理論框架和方法體系,具有較強的科學意義。

相關詞條

熱門詞條

聯絡我們