蛋白質相互作用預測的集成學習方法研究

《蛋白質相互作用預測的集成學習方法研究》是依託湖南大學,由曹智擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:蛋白質相互作用預測的集成學習方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:曹智
  • 依託單位:湖南大學
中文摘要,結題摘要,

中文摘要

蛋白質是生物功能的直接執行者,而蛋白質相互作用是細胞進行一切代謝活動的基礎,因此,蛋白質相互作用成為了當前蛋白質組研究的一個熱點。這個問題的解決能夠為蛋白質功能的分析、生命發育的探索、有效藥物的開發等提供基礎。本項目將以蛋白質序列特徵為基礎,通過構建蛋白質相互作用標準數據集,預測並評估蛋白質相互作用,最終將構建高質量的蛋白質相互作用網路,用於識別關鍵基因、藥靶及發現複合物和功能模組等套用:根據胺基酸的理化性質,基於模糊理論對20種胺基酸分類,在分類的基礎上結合距離頻率、L-Z 複雜度、字元頻率特徵和字元位置特徵來獲取蛋白質序列信息的特徵值,有效提取蛋白質序列信息;根據多個蛋白質相互作用資料庫篩選正樣本,設計負樣本篩選算法,進而構建蛋白質相互作用標準數據集;基於隨機子空間和特徵映射的集成學習框架,保證預測模型的準確性、泛化能力;基於流形學習的蛋白質相互作用可信度評估,過濾預測結果中的噪聲

結題摘要

蛋白質是生物功能的直接執行者,而蛋白質相互作用是細胞進行一切代謝活動的基礎,因此蛋白質相互作用成為了當前蛋白質組研究的一個熱點。這個問題的解決能夠為蛋白質功能的分析、生命發育的探索、有效藥物的開發等提供基礎。本項目將以蛋白質序列特徵為基礎,通過構建蛋白質相互作用標準數據集,預測並評估蛋白質相互作用,最終將構建高質量的蛋白質相互作用網路,用於識別關鍵基因、藥靶、發現複合物和功能模組等套用:根據胺基酸的理化性質,基於模糊理論對20種胺基酸的分類,在分類基礎上結合距離頻率、L-Z 複雜度、字元頻率特徵和字元位置特徵來獲取蛋白質序列信息的特徵值,有效提取蛋白質序列信息;根據多個蛋白質相互作用資料庫篩選正樣本,設計負樣本篩選算法,進而構建蛋白質相互作用黃金數據集;基於隨機子空間和特徵映射的集成學習框架,保證預測模型的準確性、泛化能力;基於流形學習的蛋白質相互作用可信度評估,過濾預測結果中的噪聲。

相關詞條

熱門詞條

聯絡我們