胺基酸變異與神經退化疾病關聯性的融合分析模型

胺基酸變異與神經退化疾病關聯性的融合分析模型

《胺基酸變異與神經退化疾病關聯性的融合分析模型》是依託蘇州大學,由楊洋擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:胺基酸變異與神經退化疾病關聯性的融合分析模型
  • 項目類別:青年科學基金項目
  • 項目負責人:楊洋
  • 依託單位:蘇州大學
項目摘要,結題摘要,

項目摘要

本項目提出的生物問題是,如何充分利用已有文獻和數據,建立生物信息學模型分析胺基酸變異與神經退化疾病之間的關聯關係。從而預測對該類疾病具有突出貢獻的變異,為精準確定病理提供輔助。該課題是一個新的研究角度,符合當前精準醫學的要求,有較大的社會意義和套用價值。.研究內容和創新包括:(1)通過事件發現模型,用文本挖掘方法從頭收集訓練數據。既是本項目預測模型的質量保障,也能為該領域研究者提供新的高質量的基準數據集。(2)完全基於胺基酸性質和序列信息,分別建立新的胺基酸變異對蛋白質聚集性和結構穩定性影響的預測模型,特色是通過設計級聯結構的多分類預測和分層篩選特徵,提高模型的泛化性和魯棒性;(3)基於已有預測影響蛋白質溶解性、無序性模型和上述聚集性、穩定性模型,設計融合策略,建立特別適用於分析胺基酸變異與神經退化疾病關聯的融合模型,用來尋找與這類疾病有緊密關聯的變異,並發布軟體系統供醫學研究者使用。

結題摘要

蛋白質是生命體各類功能的載體,從胺基酸變異對蛋白質結構功能各方面的影響進行預測,是分析其是否有致病關聯的重要途徑。用實驗方法研究步驟複雜、時間和經濟成本高昂,而使用生物信息學方法,充分收集利用已有數據,通過計算來分析預測,可以有效地解決這一難題。神經退化類疾病具體分為40多種,症狀各異,但發病機理相似。隨著老齡化社會的到來,越來越受到廣泛關注。本課題基於機器學習的方法,研究了預測胺基酸變異對蛋白質結構和功能影響的方法和模型,並基於此構建融合模型,用於分析其與神經退化疾病的關聯性,具體工作包括:(1)從文獻中收集數據,構建和發布了與已報導37種神經退行性疾病有關聯的6000多條變異信息的標準化資料庫NDDVD,並進行更新維護:(2)通過數據挖掘和人工驗證結合的方法,從頭收集驗證了胺基酸變異對於蛋白質結構穩定性變化的相關數據,修正了已有資料庫存在的錯漏,發布了高質量的標準數據集。在此基礎上運用隨機森林方法,並進行了相關屬性篩選,建立了兩層三分類的新預測模型PON-tstab;(3)運用梯度增強回歸樹等方法構建了基於序列信息預測蛋白質變性溫度Tm的蛋白質穩定性預測模型ProTstab,並套用該工具,預測了全部人類蛋白質的變性溫度。在上述工作基礎上,構建了初步的NDD相關變異的融合分析方法,篩選了部分高致病性的候選變異。主要成果包括發表(接受)論文11篇,其中SCI期刊論文9篇,申請發明專利3項,軟體著作權4項。上述工作對於進一步深入探究神經退化類疾病的致病機理,尋找重要的生物標記物,從而輔助疾病分子診斷和藥物設計具有重大定義。構建的NDDVD相關變異資料庫質量可靠,訪問便捷;設計實現的預測模型性能較高,泛化性強,軟體使用方便,為進一步的研究提供了可靠的基礎。

相關詞條

熱門詞條

聯絡我們