生物信息學中的序列分析相關問題研究

生物信息學中的序列分析相關問題研究

《生物信息學中的序列分析相關問題研究》是依託中南大學,由潘毅擔任項目負責人的面上項目。

基本介紹

  • 中文名:生物信息學中的序列分析相關問題研究
  • 項目類別:面上項目
  • 項目負責人:潘毅
  • 依託單位:中南大學
項目摘要,結題摘要,

項目摘要

測序技術的發展和隨之產生的海量序列數據對現代生命科學研究帶來了前所未有的機遇和挑戰。如何採用計算機技術解決序列分析的前沿問題成為國家重大戰略需求和重大工程需求的關鍵任務。本項目分別研究新一代測序技術下的片段比對算法、短片段組裝算法、多序列比對算法與SNP序列與疾病關聯性分析算法。通過收集序列數據和其他相關生物數據,並對其數據本身進行特症挖掘,基於多序列比對的結果,在雲計算平台下參考比對短片段,然後組裝這些短片段,進行SNP與疾病關聯分析,最後再使用實際生物數據以及反饋信息對相關算法進行驗證與改進。本項目的研究將為海量序列數據的分析提供高效的計算方法,為疾病診斷與治療的研究提供新思路。

結題摘要

在本基金的資助下,按照研究計畫中的研究內容和技術路線,本項目重點研究了新一代測序技術下的序列組裝算法、序列比對算法和SNP序列與疾病關聯分析算法,取得的主要研究成果如下:1. 基於新一代測序技術下的雙端讀數提出了疊代種子擴展的拼接算法ISEA,可以獲得更長和更準確的scaffolds;針對宏基因組組裝計算量大的問題,提出了宏基因組組裝工具框——DIME;為了定位和糾錯contigs中的組裝錯誤,我們提出了基於雙端讀數分布的糾錯方法MEC。2. 為解決現有工具部分讀數無法比對到參考基因組的問題,提出了一種基於鹼基測序質量的修剪策略來確定片段中最長最可信的部分的方法 RAUR 來重新比對那些未比對上的片段。開發了甲基化可視化比對工具VAliBS,能夠輔助輔助DNA甲基化研究。3. 提出了用於解決微同源缺失和微插入缺失的結構變異檢測算法Sprites。此外,本項目還提出了一種新的尋找高階SNP組合和複雜疾病關係的方法,基於能量分布的差異,能同時分析所有的SNPs。

相關詞條

熱門詞條

聯絡我們