面向複雜生物數據處理的高效計算方法

面向複雜生物數據處理的高效計算方法

《面向複雜生物數據處理的高效計算方法》是依託中南大學,由王建新擔任項目負責人的重點項目。

基本介紹

  • 中文名:面向複雜生物數據處理的高效計算方法
  • 項目類別:重點項目
  • 項目負責人:王建新
  • 依託單位:中南大學
項目摘要,結題摘要,

項目摘要

基因組學、蛋白組學等領域的發展對現代生命科學研究帶來了前所未有的機遇和挑戰。如何尋求生物信息學新計算技術解決生命科學領域的國際前沿問題已成為國家重大戰略需求和重大工程需求的關鍵科學問題。本項目將跳出傳統計算機算法設計思路,首先分析生物數據的多元特性,挖掘影響問題複雜性的關鍵參數,刻畫生物計算問題的多元模型。然後,基於生物計算問題多元模型,結合參數計算方法、啟發式方法、數據壓縮方法和多元信息融合方法,解決生物計算中的相關熱點和難點問題,建立一套面向生物數據特徵的生物計算難解問題系統求解方法。最後,本項目將基於生物計算問題的算法研究成果,建立自主智慧財產權的相關軟體處理平台,並實際套用於複雜疾病的診斷、分析和治療中。本項目的研究將為複雜生物數據處理提供高效的計算方法,為面向重大工程需求進行數據特徵挖掘和高效計算方法的研究提供新思路,推動我國面向實際工程和國家重大需求的高效計算方法的研究和套用。

結題摘要

在本基金的資助下,課題組針對基因組序列分析與組裝、蛋白質結構及功能預測、生物網路構建與分析、疾病-miRNA和lncRNA關係預測、生物顯微圖像重構等複雜生物數據處理中的若干關鍵問題展開研究,主要成果如下:1. 深入分析了序列數據、蛋白質相互作用數據等各種不同類型生物數據的噪聲分布情況,結合生物數據之間的強關聯關係研究了生物數據去噪處理的方法;深入挖掘了複雜生物數據自身所固有的特徵,為研究面向數據特徵的高效計算方法提供了依據;2. 針對新一代測序技術和宏基因組數據,重點研究了短片段拼接、結構變異發現和高階SNP發現等生物計算問題,利用雙端讀數分布、insert size分布等特徵,設計了基於De Bruijn圖的序列組裝方法、基於路徑擴展的scaffolding方法和基於讀數分割策略的gap填充方法以及結構變異發現和高階SNP發現方法;3. 通過融合轉錄組、肽標識蛋白質信息以及互作組信息設計了蛋白質鑑定方法;提出了單分子定位和貝葉斯技術相結合的新型活細胞超解析度顯微技術用於蛋白質的精確定位;4.針對靜態蛋白質網路分析的若干局限性,通過融合時間序列下的基因表達等數據,提出了新的動態蛋白質網路構建方法,設計了基於蛋白質活性的複合物提煉方法和基於蛋白質網路拓撲特性及多元生物信息的一系列蛋白質複合物挖掘方法;5. 通過融合多相似性網路並基於核貝葉斯矩陣分解、邏輯矩陣分解和隨機遊走等技術,提出了一系列疾病-miRNA、疾病-lncRNA關係預測方法和藥物重定位方法;6. 針對生物顯微圖像重構的高性能計算問題,提出了一系列生物大分子冷凍電鏡圖像處理方法、生物大分子冷凍電鏡圖像重構算法和大規模、大尺度的生物大分子冷凍電鏡數據並行處理方法。7. 基於生物計算中若干問題的數據特徵,通過挖掘影響問題複雜性的若干關鍵參數,建立了相關問題的多元參數模型,並給出了多元參數模型的複雜性分析和參數算法設計;8. 在提出的上述方法的基礎上設計開發了一系列開源的生物計算軟體和web線上服務工具。

相關詞條

熱門詞條

聯絡我們