《基於質譜數據的非限制性翻譯後修飾檢測算法研究》是依託中國科學院數學與系統科學研究院,由付岩擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於質譜數據的非限制性翻譯後修飾檢測算法研究
- 項目類別:青年科學基金項目
- 項目負責人:付岩
- 依託單位:中國科學院數學與系統科學研究院
項目摘要,結題摘要,
項目摘要
蛋白質翻譯後修飾(PTM)能夠改變蛋白質的結構,調控蛋白質的活性。研究 PTM 對於闡明蛋白質的功能,解釋疾病的發生機理等,都具有十分重要的意義。基於質譜技術的蛋白質組學為大規模PTM研究提供了有效的分析手段,利用串聯質譜數據檢測PTM已成為目前蛋白質組學研究的核心和前沿問題之一。但是,常規的質譜數據分析算法和蛋白質鑑定軟體採用限制性的PTM檢測模式,具有盲目性、搜尋空間組合爆炸、不能發現新類型PTM等嚴重問題。本課題旨在提出一個完整高效實用的非限制性PTM檢測計算解決方案。所謂非限制性,是指無需人為預限定一個PTM列表,而能夠檢測任意PTM。本課題擬採取分而治之、逐步深入的數據分析策略,針對不同特點的PTM,使用不同的PTM檢測算法,包括:高豐度PTM快速發現、開放式譜-譜匹配、開放式肽-譜匹配等。通過深入挖掘質譜數據中蘊藏的豐富PTM信息,為生物知識的發現提供有效的計算分析手段。
結題摘要
基於質譜技術的蛋白質組學為大規模蛋白質修飾研究提供了有效的分析手段,但目前常規的限制性修飾檢測方法具有盲目性和不能發現新類型修飾等缺陷。課題圍繞基於質譜數據的蛋白質修飾發現問題,按計畫順利開展研究,取得了一系列重要研究成果,達到了預期目標,並有所超出。主要進展包括:(1)首次提出了基於肽母離子聚類的快速修飾檢測算法,該算法基於肽的修飾和非修飾形式通常同時存在這一先驗知識,充分利用肽母離子的精確質量和色譜保留時間信息,通過機率混合模型和EM算法以極快的速度檢測高豐度的修飾類型,相應研究結果發表在了蛋白質組學著名期刊Molecular & Cellular Proteomics;(2)首次提出了基於開放式譜庫搜尋的修飾檢測算法,該算法同樣基於修飾和非修飾肽同時存在這一前提,但是利用二級譜圖信息,因此可以檢測低豐度修飾,通過與傳統序列庫搜尋方法相結合,該算法可以較快的檢測任意豐度的修飾並顯著提高譜圖解析率,相應研究結果發表在了生物信息學頂尖會議ISMB及生物信息學著名期刊Bioinformatics;(3)設計了新的基於開放式序列搜尋的修飾檢測算法,該算法不依賴於修飾和非修飾肽同時存在的假設,因而可以檢測任何情形的修飾類型,該算法只用於分析抗訴兩個算法無法解析的譜圖,並且通過合理的算法設計和程式最佳化,計算量得到了有效縮減;(4)基於上述算法開發了實用軟體,形成了非限制性修飾檢測的完整數據分析流程。(5)預研了修飾檢測結果的統計顯著性評估問題,初步成果已發表。大量實驗表明上述算法可以高效檢測各類蛋白質修飾,並顯著提高質譜數據解析率。所開發的實用軟體(pCluster、pMatch、以及pFind開放式搜尋版)已開始被國內外蛋白質組學界使用。在課題支持下,發表學術論文9篇,申請專利4項,申請軟體著作權2項,在國內外重要學術會議做報告7次,並組織了首屆中國計算蛋白質組學研討會。