基於高通量測序數據研究基因組變異的統計問題

《基於高通量測序數據研究基因組變異的統計問題》是依託北京大學,由席瑞斌擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於高通量測序數據研究基因組變異的統計問題
  • 依託單位:北京大學
  • 項目負責人:席瑞斌
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

人類基因組中有包括結構變異在內的多種變異,它們對人類的健康有重大影響。癌基因組通常比正常基因組有更多的變異,其中一些可能對腫瘤生成起到了關鍵的作用。近年來,高通量測序技術的革命性突破為我們提供了一個高效的研究基因組變異的平台,但其帶來的數據爆炸性增長對我們的統計計算分析能力提出了嚴峻的挑戰。特別地,由於結構變異的複雜性及高通量測序數據讀長太短及分布不均勻的缺點,目前探測結構變異算法在其準確度及靈敏度方面仍有很大的局限。在本項目中,我們將針對基於高通量測序數據研究和分析結構變異的一些問題展開研究,發展穩健的機率統計模型及高效的算法,並研究其對應的統計性質。我們將主要通過建立一些半參數模型或貝葉斯模型來解決這些問題。同時,我們將充分考慮所面臨問題的具體情況以建立更加符合實際情況的模型。我們還將發展對應的統計軟體包以方便其他學者使用,並會將這些算法套用到實際數據中以獲取新的生物學知識。

結題摘要

本項目主要考慮發展利用高通量基因組測序數據,如全基因組測序及全外顯子測序數據,探測拷貝數變異及結構變異的工具並利用結構變異研究癌基因組驅動變異。腫瘤目前已經成為中國乃至全球的首要死亡原因,癌基因組中常常存在大量的結構變異,結構變異的準確探測和深度分析對研究腫瘤的發生髮展、對於研究腫瘤的治療手段都有重要的作用。高通量測序技術的發展對於準確探測和研究結構變異提供了強大的技術平台。在本項目支持下,我們發展了一系列的探測結構變異和拷貝數變異的統計計算方法和工具,並開發了相應的軟體或軟體包,這些新的算法比已有算法的性能有顯著的提高;其中一些算法,如BIC-seq2目前已經被很多研究包括發表於Science, Cell等頂級雜誌的研究所才用。通過分析結構變異、拷貝數變異和其他類型的變異,我們研究了肝癌、肝內膽管癌和乳腺癌的驅動變異,如我們在肝內膽管癌中發現染色體不穩定是腫瘤發生髮展的早期事件,可能是腫瘤異質性的主要原因之一。這些研究成果對於研究腫瘤的驅動變異乃至對腫瘤的精準治療都有重要的意義。

相關詞條

熱門詞條

聯絡我們