腫瘤拷貝數異常檢測的生物信息學算法研究

《腫瘤拷貝數異常檢測的生物信息學算法研究》是依託中國科學技術大學,由李驁擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:腫瘤拷貝數異常檢測的生物信息學算法研究
  • 項目類別:青年科學基金項目
  • 項目負責人:李驁
  • 依託單位:中國科學技術大學
中文摘要,結題摘要,

中文摘要

拷貝數異常是腫瘤基因組的重要特徵,對研究癌變產生和發展過程、癌症的臨床診斷及治療、抗癌藥物的開發具有重要意義。作為目前拷貝數異常的最新檢測技術,單核苷酸多態性微陣列具有基因組水平解析度高的優點,但易受到腫瘤自身特性及噪聲等因素的影響,因此檢測精度亟待提高。本課題擬從統計建模的角度出發,深入研究並解決:(1)臨床對照實驗中拷貝數異常的變化;(2)腫瘤-正常組織連配數據的利用;(3)腫瘤中多個癌細胞克隆的存在;(4)檢測中不適定情況的識別這四個拷貝數異常檢測技術研究中的熱點和難點問題。相關的研究工作將以GPHMM統計框架為基礎,從生物學角度分析以上問題對微陣列數據處理造成的影響,通過發展新穎的統計模型及模型訓練和參數估計算法,有效提高拷貝數異常檢測的性能。在此基礎上,通過開發適用於複雜情況、滿足不同實際需求的生物信息學軟體工具,完善基於SNP-array的高通量全基因組腫瘤拷貝數異常檢測技術。

結題摘要

拷貝數異常在癌症研究方面具有重要意義。包括單核苷酸多態性微陣列、新一代測序等目前流行的高通量技術易受到腫瘤自身特性及噪聲等因素的影響,因此給全基因組拷貝數異常檢測帶來了很大的挑戰。本項目從統計建模的角度出發,對基於上述高通量實驗技術的腫瘤全基因組異常檢測中的一些關鍵理論問題進行了深入的研究。對於腫瘤異質性情況下的拷貝數異常檢測,提出了反映腫瘤中不同克隆拷貝數異常的腫瘤多克隆混合模型,在此基礎上發展了基於SNP array的異質性腫瘤拷貝數異常檢測方法,不僅可以檢測腫瘤存在的多種不同的癌細胞克隆,而且可以對克隆間共有或獨有的拷貝數異常及雜合性缺失進行準確檢測。在新一代全基因組的腫瘤數據分析中,通過參考基因組信息提取出測序讀深和等位基因頻率信號,並發展了對上述信號較為完善的預處理技術和具有國際領先水平的檢測方法。此外,在成對SNP array數據的建模研究中,利用正常組織基因型等信息對GPHMM的建模方式進行改進,有效提高了對拷貝數異常檢測的魯棒性,並在此基礎上發展對腫瘤基因組復發變異的統計顯著性分析方法,通過對乳腺癌、肝癌的數據分析,發現了腫瘤基因組上大量的復發異常區域及癌症相關基因。為準確檢測赫賽汀臨床治療對照實驗中拷貝數異常的變化,在研究中發展了一種基於多元方差分析的有效分段算法。針對腫瘤拷貝數異常檢測中的不適定問題,提出利用信息熵作為不適定問題的有效檢測指標並取得了很好的效果。上述研究成果為基於高通量實驗技術的腫瘤拷貝數異常檢測提供了更為完善的理論方法和多種有效的生物信息學工具。

相關詞條

熱門詞條

聯絡我們