激酶特異性的蛋白質磷酸化預測方法研究

激酶特異性的蛋白質磷酸化預測方法研究

《激酶特異性的蛋白質磷酸化預測方法研究》是依託中國科學技術大學,由王明會擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:激酶特異性的蛋白質磷酸化預測方法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:王明會
  • 依託單位:中國科學技術大學
中文摘要,結題摘要,

中文摘要

蛋白質磷酸化過程是真核細胞生命活動最普遍的調控手段,具有重要的研究意義。發展基於機器學習理論的蛋白質磷酸化預測方法,可以彌補現有實驗檢測技術中的缺陷,有助於蛋白磷酸化的研究。本課題從以下三個方面改進現有蛋白質磷酸化的預測方法:(1)發展專用的機器學習分類方法,擴充現有磷酸化蛋白質數據中所缺乏的蛋白激酶信息,大幅度增加蛋白質磷酸化預測工作的可用數據量;(2)收集目前所有已知有助於蛋白質磷酸化預測的生物信息特徵加以系統全面地研究;(3)引入wrapper、隨機森林等新的特徵選擇技術,將特徵選擇和蛋白質磷酸化預測緊密結合起來。通過從數據、特徵、算法三個角度同時改進現有方法,可以顯著提高蛋白質磷酸化預測的性能,並有助於闡明蛋白質磷酸化的生物學機理。在此基礎上,構建擴展磷酸化蛋白質和蛋白激酶信息的網路公共資料庫和激酶特異性蛋白質磷酸化的線上預測系統,為相關的生物、醫學、製藥等研究提供理論指導和幫助。

結題摘要

蛋白質磷酸化過程具有重要意義,目前國內外的相關研究日益增多。本項目從數據、特徵、算法三個角度對基於機器學習理論的蛋白質磷酸化預測問題進行了深入研究。首先,系統地蒐集、整理了大量蛋白質磷酸化位點和其相關的蛋白激酶信息,建立了算法訓練和性能評估的高質量數據集並發展了有效利用多源異質生物信息特徵的蛋白激酶指派算法,其性能顯著優於目前現有的預測方法。此外,構建了包括磷酸化位點附近的局部序列、蛋白-蛋白相互作用、基因本體信息、二級結構、可溶性和無序性在內等多種生物學特徵,用於蛋白質磷酸化的預測研究。在上述研究的基礎上,針對磷酸化相關特徵維數過高的問題,提出了基於最小冗餘最大相關準則的wrapper特徵選擇方法,通過與SVM、random forest等分類器結合,對蛋白激酶及特異性的磷酸化位點進行準確預測,並對特徵選擇和預測的結果從生物學角度進行了分析和理解,有助於闡明蛋白質磷酸化的分子機理。針對目前普遍認可的蛋白激酶層級結構(組-家族-亞家族-激酶),從不同層面上研究了磷酸化預測以及相關特徵選擇的問題,取得了一些具有普遍意義的發現,顯著提高了現有預測方法在不同激酶層級上的最好性能。此外,利用在上述研究中發展的預測算法,首次系統地開展了磷酸化修飾與人類重大疾病相關性的預測工作。作為重要的生物信息學資源,開發了用於蛋白激酶指派的網路計算平台PKIS,同時公開了研究中所提出的特徵選擇和預測算法的原始碼以及相應的磷酸化位點和蛋白激酶的數據,為磷酸化相關的生物、醫學、製藥等研究提供理論指導和計算工具。

相關詞條

熱門詞條

聯絡我們