《套用ADMM預測蛋白質結構》是依託南京航空航天大學,由郭雨珍擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:套用ADMM預測蛋白質結構
- 項目類別:青年科學基金項目
- 項目負責人:郭雨珍
- 依託單位:南京航空航天大學
項目摘要,結題摘要,
項目摘要
蛋白質結構預測問題是生物信息學中最具有挑戰的問題之一。在生物系統自身比較複雜的背景下,建立有效的數學模型和尋找合理的最佳化算法成為生物信息學研究的一個核心內容。本項目主要解決在三維格線上胺基酸序列的摺疊問題。之前,學者們只是針對HP格點模型(只有一種作用力)進行建模和求解,但由於模型的太過簡化,預測的結構與真實結構偏差很大。為此本項目將選取兩種相互獨立的作用力作為影響能量函式的因素,建立具有分離變數的能量函式表達式;然後,給出滿足ADMM框架下的最佳化模型;針對ADMM的子問題,本項目將改進粒子群算法並構造調整策略;本項目將在三維格線上進行數值模擬,並比較模擬的結構和真實結構的相似度。本項目的研究不僅可以為生物信息學者提供可靠的理論方法,還使得生物問題數學化,促進最最佳化理論與方法和蛋白質結構預測的交叉研究,加快國內系統生物學這一交叉學科的發展。
結題摘要
蛋白質結構預測問題是生物信息學中最具有挑戰的問題之一。在生物系統自身比較複雜的背景下,建立有效的數學模型和尋找合理的最佳化算法成為生物信息學研究的一個核心內容。本項目主要解決胺基酸序列的摺疊問題。我們主要完成了二維菱形格線的胺基酸序列摺疊問題、二維平面范德華力作用下三向和四向的胺基酸序列結構的摺疊問題和三維hp格線的蛋白質結構摺疊問題以及各類問題的整合模型和模擬。針對研究的各個問題,我們給出了相應的數據分析。HP菱形格線的二維結構比之前文獻里的方格網上求解的結構靈活多變,但由於維數的限制結構的形態僅僅只是三維結構的在平面上的映射,所以與蛋白質結構庫的結構進行比對還是有偏差,另外菱形網上也只能預測長度為17,20,25,36等短序列的結構。范德華力作用下二維三向和二維四向的模型得到的結構比方格網下得到的結構更靈活,最大的特點是序列的長度大大增加,長度可以達到5000左右,預測長度是1000的序列的結構也僅僅只需要5小時左右,但目前研究只給出平面結構。各種模式的整合模型得到的結構,包羅了HP和范德華力作用下的各種優點,計算長度也增加。在模式整合論文中,我們利用廣義Benders進行求解,並嚴格證明了問題的解的存在性。這部分理論結果為我們後面三維結構預測提供了非常有利的理論依據。