蛋白質相互作用和基因功能關聯的對稱性預測方法研究

《蛋白質相互作用和基因功能關聯的對稱性預測方法研究》是依託哈爾濱工業大學,由劉曉燕擔任項目負責人的面上項目。

基本介紹

  • 中文名:蛋白質相互作用和基因功能關聯的對稱性預測方法研究
  • 依託單位:哈爾濱工業大學
  • 項目類別:面上項目
  • 項目負責人:劉曉燕
項目摘要,結題摘要,

項目摘要

本項目針對生物信息學中典型的對稱性預測問題,發展適合的機器學習pairwise核方法,通過度量兩對對象之間的相似度,解決蛋白質相互作用、基因功能關聯這兩類對稱預測問題。首先,構建用於客觀反映pairwise核方法分類性能的數據集,通過平衡隨機採樣的方法構建反例數據集。然後,根據核函式的正定性約束條件,引入對稱性運算,研究pairwise核的一般規律,探尋非向量形式數據類型上的最優解求解方法,並將新型核方法用於蛋白質相互作用、基因功能關聯這兩類預測問題。最後,將傳統的直系同源方法與新型的pairwise核方法相結合,研究跨物種預測大豆蛋白質相互作用及基因功能關聯的方法,豐富相應的數據。本項目對開拓新的核函式理論與預測方法、研究人工智慧與分子生物學的結合都具有重要的理論意義,並在大豆分子功能理解方面具有潛在的套用價值。

結題摘要

生物大分子之間的互作一直是生物信息學的研究熱點之一,本項目利用信息方法,針對蛋白質相互作用(Protein-protein interaction,簡稱PPI)、基因功能關聯(Gene-gene association,簡稱GGA)這兩個問題開展工作,並以大豆(Glycine max)、人類等組學數據為基礎加以實現、驗證。項目屬於生物信息學、計算生物學交叉學科研究方向,取得如下重要結果: (1)在基因功能關聯預測方面,提出了一種GWAS中基於信息增益的基因-基因互作挖掘算法,在仿真數據和真實數據中進行了驗證。提出了利用隨機遊走策略挖掘疾病風險基因的方法,為研究複雜疾病的相關基因及其作用機制提供了一種新途徑。研究了組織共有eQTL的識別方法,有別於此前多項研究對組織特異eQTL的功能分析。 (2)研究了蛋白質功能預測的相關計算問題,包括基於序列和基於PPI網路的兩種預測方法。首先提出了一種基於序列結構域組成的蛋白質功能預測方法,它不受其它複雜生物特徵提取難度的限制。對於後者,在提出基於GO注釋信息蛋白質功能相似性計算方法基礎上,給出了基於結構域相互作用的PPI網路構建算法,進而完成功能預測研究。 (3)在跨物種預測大豆GGA和PPI方面,提出了一種基於靶基因網路推導大豆microRNA功能網路(miRFN)的方法,該方法也適用於其它模式或非模式生物;實現了大豆miRFN及其靶基因網路的相關信息檢索與分析線上工具,將有助於在系統水平上揭示miRNA-miRNA和miRNA-基因互作機制。同時,構建了一個關於大豆功能基因網路和大豆miRNA功能網路的資料庫——大豆功能網路資料庫(SoyFN),受到人們關注。 (4)在機器學習相關算法研究方面,提出了一種基於SVM的主動學習算法,用來解決蛋白質相互作用的預測問題。同時,針對生物信息學中正、反例不平衡問題,給出了構造合理反例集的算法,用於基於蛋白質互作數據的基因功能推斷方法。 共發表論文35篇,其中國際刊物20篇、國核心心刊物12篇、國際會議論文3篇;SCI、EI分別收錄20篇、5篇。授權軟體著作權2項。結合本項目研究工作,培養博士生6人(已畢業4人)、碩士生8人(已畢業6人)。 本項目將對蛋白質互作、基因互作關係預測的信息方法研究具有重要的理論意義,並可為生物學家理解大豆分子功能提供一定的借鑑。

相關詞條

熱門詞條

聯絡我們