功能基因網路的重構與交疊模組識別方法

《功能基因網路的重構與交疊模組識別方法》是依託哈爾濱工業大學,由郭茂祖擔任項目負責人的面上項目。

基本介紹

  • 中文名:功能基因網路的重構與交疊模組識別方法
  • 依託單位:哈爾濱工業大學
  • 項目類別:面上項目
  • 項目負責人:郭茂祖
項目摘要,結題摘要,

項目摘要

生物網路作為一種複雜網路是近幾年信息科學的研究熱點之一,本項目針對功能基因網路重構及其模組識別問題,發展對分子互作數據依賴性低的重構方法,並研究適合於該網路的交疊模組識別方法。首先,提出一種充分考慮基因本體(GO)結構信息的語義相似性計算方法,進而採用組合平均法和基於聚類係數的閾值選擇方法構建全基因組的功能基因網路。然後,研究基於基因標籤傳播的交疊模組識別方法,提出傳播強度概念,用以描述基因間拓撲結構;並提出基於度分布的基因更新序列以及基於Clique的基因標籤設定方法,進一步提高識別的準確性與穩定性。最後,針對基因模組的層級性和網路動態性,分別給出基於有向無環圖(DAG)描述的層級結構獲取方法和基於共現矩陣的動態網路交疊模組識別方法。本項目對開拓新的生物信息學方法、研究算法理論與生物科學的結合都具有重要的理論意義,並在生物複雜網路結構分析方面具有潛在的套用價值。

結題摘要

生物網路是生物信息學的研究對象之一,而功能基因網路作為源於而又高於組學數據的一種網路形式,近幾年受到人們關注。該項目利用信息理論與算法,圍繞功能基因網路的重構與模組識別方法這兩個問題開展工作,並重點研究了基於主流知識表示方法——基因本體(GO)的功能相似性計算方法、以及更好體現生命活動的蛋白質網路中複合體識別算法。項目屬於生物信息學、計算生物學交叉學科研究方向,取得如下重要結果: (1)在基因功能相似性計算方面,借鑑生物學機理,提出了基於細胞分化的GO語義相似性算法——最短語義分化距離。提出了一種基於哈希表的蛋白質功能相似度計算方法,提高了計算速度。 (2)在功能基因網路重構方面,提出了基於距離不等式的 K-medoids 聚類算法,降低了計算複雜度。並從多角度研究了蛋白質功能網路預測方法,分別考慮了動-靜態混合型時序蛋白質、蛋白質結構域組成和主-被動協作關係等因素。 (3)提出了一種基於多標籤傳播的複合體識別算法,定義了傳播強度,算法具有更高的識別準確率和良好的魯棒性。構建了識別複合體的最小二乘法模型,具有較高的功能富集性。 (4)在交疊模組的層級化結構獲取方面,構造了一種蛋白質模組度函式,並採用基於度相關性的初始簇選擇方法,提高了層次聚類方法識別複合體的效率和針對性。 (5)提出了一種基於時序蛋白質網路的複合體識別方法,體現動態和靜態兩類蛋白質的特性,提高了識別複合體的準確性。提出了基於偽3D聚類算法的雙層網路模組識別方法,能自動確定最優的模組劃分等。 共發表論文44篇,其中期刊論文38篇(包括國際刊物25篇)、會議論文6篇;SCI、EI、中文核心期刊分別收錄25篇、10篇、11篇。授權軟體著作權2項。結合本項目研究工作,培養博士生8人、碩士生7人。 本項目將對進一步理解功能基因網路具有重要的理論意義,對利用信息科學的本體表示和模組識別算法研究生物信息學問題具有借鑑作用。

相關詞條

熱門詞條

聯絡我們