基於機器學習的蛋白質相互作用與功能預測方法研究

基於機器學習的蛋白質相互作用與功能預測方法研究

《基於機器學習的蛋白質相互作用與功能預測方法研究》是依託同濟大學,由黃德雙擔任項目負責人的重點項目。

基本介紹

  • 中文名:基於機器學習的蛋白質相互作用與功能預測方法研究
  • 項目類別:重點項目
  • 項目負責人:黃德雙
  • 依託單位:同濟大學
中文摘要,結題摘要,

中文摘要

蛋白質相互作用與功能預測問題是當前蛋白質組學要解決的核心問題之一,這個問題的解決將有助於理解生命現象的本質,並對生命科學的發展起到強有力的推動作用。本項目將從蛋白質序列出發,在蛋白質相互作用的數據整合、特徵編碼、預測和結果校準以及蛋白質功能預測方面進行深入研究,以探索蛋白質相互作用及其功能行使的規律與本質。首先,在整合多個相互作用數據源的基礎上,利用胺基酸殘基理化性質,結合自相關、多聯體和結構域組成等方法對蛋白質序列進行編碼,並運用神經網路學習委員會機和元集成學習方法分別集成多種編碼方式來提高蛋白質相互作用預測性能;然後利用流形學習方法來校準預測結果中的假陽性與假陰性問題;最後,利用基於圖的半監督學習和加權蛋白質相互作用網路來預測蛋白質的功能,並進一步基於組合核方法來融合蛋白質多源信息,提高蛋白質功能的預測精度。本項目的研究成果將加深對生命機理的認識,為疾病機理的揭示及新藥研發提供指導。

結題摘要

蛋白質相互作用和蛋白質功能預測是當前蛋白質組學要解決的關鍵問題之一,這個問題的解決將有助於理解生命現象的本質,並對整個生命科學的發展都將起到強有力的推動作用。本項目將從蛋白質的最基本特徵即序列特徵出發,在蛋白質相互作用的數據整合、特徵編碼、分類識別和預測結果校準方面進行深入研究,以探索蛋白質相互作用的規律與本質。首先,在整合來自不同數據源相互作用數據的基礎上,利用胺基酸殘基的理化性質,並結合矩陣分解方法對蛋白質序列進行編碼;然後,運用主成分分析和極限學習機這兩種多分類器集成算法來預測蛋白質相互作用,並結合柔性神經樹方法最佳化參數,以達到更好的預測效果;最後利用流形學習方法來校準預測結果中的假陽性與假陰性噪聲問題,從而得到高可靠性的蛋白質相互作用預測模型。本項目的研究成果將為了解蛋白質功能的實現機制和治療相關疾病的藥物設計提供理論上的依據。

相關詞條

熱門詞條

聯絡我們