de novo預測蛋白質結構的並行元啟發方法研究

de novo預測蛋白質結構的並行元啟發方法研究

《de novo預測蛋白質結構的並行元啟發方法研究》是依託蘇州大學,由呂強擔任項目負責人的面上項目。

基本介紹

  • 中文名:de novo預測蛋白質結構的並行元啟發方法研究
  • 項目類別:面上項目
  • 項目負責人:呂強
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

已知蛋白質胺基酸序列,通過計算技術,從頭(de novo)預測該蛋白質的高解析度原子級的天然立體結構。預測目標的限制是:蛋白質肽鏈的胺基酸殘基個數小於150,且與已知蛋白質序列同源一致性小於30%。.基於天然蛋白質的立體結構處於自由能全局最小狀態的假設,通過面向計算的建模,把從頭預測問題轉換為能量函式最佳化問題,用啟發式搜尋算法作為基本的構象搜尋方法,通過多目標最佳化模型和並行計算實現,融合各種自由能量函式所體現的領域知識,儘可能地利用粗粒度的實驗數據剪裁構象空間,預測出具有最低自由能量的原子解析度的蛋白質三維結構,或一組候選結構。這些結構,要么與相應的天然結構十分接近,要么有助於進一步預測和驗證該蛋白質的結構和生化功能。.本項目從方法上創新從頭預測的解決模型,從結果上更有效地解決蛋白質原子級別的高分辨三維結構的從頭預測問題,進而對基於蛋白質原子級別的三維結構的許多後續戰略性套用提供關鍵幫助。

結題摘要

蛋白質的空間結構決定其生化性質和功能。利用計算機方法預測蛋白質的空間結構,就是根據蛋白質結構由其胺基酸序列決定且總是具有最低自由能這一假設,從計算機生成的目標蛋白質的不同空間構象中找出最接近天然狀態的空間結構。所謂de novo預測蛋白質結構,就是在已知蛋白質結構資料庫中找不到同源結構的情況下,僅依據預測目標的胺基酸序列所進行的蛋白質結構預測。 重要成果如下:基於能量函式的不準確性且有用性假設,認為目前採用的所有可計算的蛋白質結構的能量函式定量地都不夠精確用來標定天然結構的蛋白質所具有最低自由能;但這些能量函式都定性地在識別蛋白質天然結構時有用。基於這個假設,本研究建立了一個用並行元啟發解決類似最佳化問題的通用框架,在能量函式和搜尋方法兩個層面實現了創新。在能量函式套用方面,把多個能量函式的有用性實施在多個搜尋執行緒中;同時,採用不同能量函式的並行搜尋執行緒隱式地交換它們的搜尋參數,從而降低各個能量函式的不準確性。在搜尋方法方面,並行的搜尋執行緒可以通過交換搜尋參數而協同搜尋,從而發揮多種啟發式搜尋方法的不同特點。 基於上述的解決方案,實現了兩個驗證算法。開發了基於並行蟻群算法的de novo預測器pacBackbone:採用同質的搜尋算法並行運行,每個並行的執行緒最佳化不同的能量函式,這些並行的蟻群執行緒共享同一個信息素從而達到實時交換搜尋參數的目的。pacBackbone在CASP8/9的測試集的性能有相當的競爭力。基於pacBackbone,將另一種經典的de nove預測器加入到並行的pacBackbone中,擴展為pacBackbone+預測器。在pacBackbone+中,異質的搜尋算法並行運行,並交換其搜尋到的中間結果。在另一個經典的測試集上,pacBackbone+表現了很好的時間和精度性能。 本項目的研究顯示,並行元啟發策略因其特有的分布性能和反饋機制是蛋白質結構預測的首選搜尋策略。一方面,元啟發複雜的並行特性能夠為融合不同能量函式提供良好的非線性平台,元啟發的靈活反饋機制很好地適合解決蛋白質結構預測中能量函式有用性且不準確的難點。另一方面,不同搜尋策略的融合需要在更細的粒度下進行,並行融合多種元啟發則提供了細粒度的融合方案,傳播了不同元啟發方法的搜尋智慧。不但為解決de novo預測蛋白質結構問題進行了可行的實踐,而且還可以為解決多目標最佳化提供了借鑑。

熱門詞條

聯絡我們