生物網路數據分析與挖掘中相關理論與關鍵技術

生物網路數據分析與挖掘中相關理論與關鍵技術

《生物網路數據分析與挖掘中相關理論與關鍵技術》是依託西安電子科技大學,由高琳擔任項目負責人的重點項目。

基本介紹

  • 中文名:生物網路數據分析與挖掘中相關理論與關鍵技術
  • 項目類別:重點項目
  • 項目負責人:高琳
  • 依託單位:西安電子科技大學
中文摘要,結題摘要,

中文摘要

蛋白質作用網路是系統生物學的核心研究內容,挑戰是如何構建可靠的蛋白質網路,並對其進行分析和挖掘,以獲取生物體的結構和功能信息。提出多因素模式識別理論,對蛋白質相互作用進行可靠性評估,建立反映動態特性的蛋白質作用網路模型。從複雜系統的角度,研究蛋白質網路的拓撲結構特徵,基於系統的核與核度理論、圖挖掘理論和組合最佳化方法,識別蛋白質網路中不同層次的功能單元:模體、模組及基於網路比對的保守模組,運用於疾病基因的發現、蛋白質功能和關鍵蛋白質的預測及基於網路數據的系統進化分析。利用網路的動態特性研究基礎網路層次上的蛋白質網路的動態干預理論與最佳化方法,設計針對動態蛋白質作用網路的模組挖掘算法,從而便於進行功能預測以及模組進化分析。本項目的特色體現在:提出新的理論框架和體系,研究蛋白質網路的構建、最佳化和控制,結合模式生物實驗數據,研究有效識別網路結構和功能模組的新算法,開發蛋白質網路結構層次的分析軟體。

結題摘要

1、在複雜網路拓撲特徵與結構分析方面進行了深入研究。提出了結構屬性量化指標,揭示了拓撲結構模式與動態控制功能的穩定性聯繫,解決了如何提高網路控制魯棒性問題。提出了基於譜空間幾何特徵刻畫網路節點間通信性的結構分析方法,發展了譜聚類理論基礎,有效解決了複雜網路結構劃分和社團分解系列問題,該成果被Physics Reports引用和高度評價。 2、在生物模式挖掘與功能預測方面進行了系統深入的研究。對模體、模組、通路等不同層次功能結構,提出了系列子圖模式高效挖掘算法,解決了不同層次生物網路功能模式檢測問題,推進了圖模型模式挖掘問題的深入研究。構建了雙色網路模型,首次解決了大規模LncRNA功能預測問題,成功預測了鼠的1625條LncRNA功能,可成功套用於人類,引起廣泛關注和NAR等引用。 3、在複雜疾病模式發現方面進行了深入研究。建立了基於全基因組變異和不同層次網路模型的疾病基因預測和致病機理分析方法,解決了多種複雜疾病的多致病因素預測問題,成功預測了年齡相關黃斑變性疾病的新SNP,發現了與乳腺癌、阿爾茨海默病和二型糖尿病相關的潛在疾病基因。系列成果可套用於其它複雜疾病研究和生物標誌物的識別。 4、在模式發現理論與方法方面進行了深入研究。提出了數據獨立的核函式用於最佳化核方法分類性能的核函式,提出了通過學習距離測度以實現強噪聲情況下的魯棒數據聚類算法。針對現有子空間聚類分析在區分類簇形狀體積方面的不足,提出基於混合模型的子空間聚類算法。系列成果可套用於生物靶標識別與疾病預測。 本項目實施過程中,在著名生物信息學國際期刊(NAR、PLoS One、BMC Bio.等)和國際會議(RECOMB、APBC、IEEE BIBM等)發表(含已錄用)論文76篇,其中國際SCI期刊46 篇,國內EI一級學報10篇。撰寫專著《生物網路數據模式挖掘與套用》,翻譯專著《基因組信號處理》,培養博士12名、碩士35名,申請公開國家發明專利3項。項目組通過積極參與相關領域主流國際會議、邀請國外專家訪問等方式,與國外同行進行了深入的學術交流與合作。參與組織國際學術會議1次,參加國際學術會議22人次,組織全國生物信息學聯合會議1次。

相關詞條

熱門詞條

聯絡我們