《基於DNA甲基化的腫瘤異質性分析及套用算法研究》是依託上海師範大學,由鄭小琪擔任項目負責人的面上項目。
基本介紹
- 中文名:基於DNA甲基化的腫瘤異質性分析及套用算法研究
- 項目類別:面上項目
- 項目負責人:鄭小琪
- 依託單位:上海師範大學
項目摘要,結題摘要,
項目摘要
腫瘤異質性是癌症放化療和藥物靶向治療時產生機體抗藥性的重要原因。目前,針對腫瘤異質性的研究大多基於基因突變、表達等遺傳信息,從表觀遺傳層面上的研究尚屬少見。DNA甲基化是一類重要的表觀遺傳修飾,其表達異常是腫瘤與正常細胞最本質的區別之一。本項目將從DNA甲基化的角度對腫瘤異質性開展生物信息學研究,開發套用算法。內容包括:(1) 以DNA甲基化的450K晶片和重亞硫酸鹽測序數據為基礎,建立腫瘤組織的多亞群混合模型,開發基於矩陣分解和最最佳化的反卷積算法,得到不同亞群的組成和特異甲基化模式;(2) 利用回歸、聚類、關聯分析等機器學習方法,研究腫瘤亞群結構與樣本生存率、基因組信息之間的關係,探索其在腫瘤發育和臨床治療中的作用;(3) 以肺癌、乳腺癌、結直腸癌等多發癌為例,建立基於DNA甲基化的腫瘤亞群演化模型。本項目的研究對進一步揭示腫瘤發育的表觀遺傳機理,設計合理的分子靶向藥物具有指導意義。
結題摘要
癌症之所以難以診斷和治療,主要原因在於腫瘤組織內部高度的異質性,即除少數癌症類型外,惡性腫瘤組織往往由不同的細胞亞群落 (sub-population或sub-clone) 組成。不同的腫瘤亞群落細胞具有不同的細胞形態、基因表達譜、代謝水平、增殖和轉移能力。這些亞群落與侵潤的免疫細胞和周邊的基質細胞、正常細胞等相互作用,構成複雜的腫瘤微環境。普遍認為,腫瘤異質性是腫瘤組織中亞群演化的結果,其與腫瘤的生長、轉移、復發、耐藥性的產生等臨床指標密切相關。本項目擬從腫瘤組織的甲基化數據出發,以信息理論、機器學習方法為工具,研究腫瘤細胞在表觀遺傳層面上的異質性。通過建立腫瘤組織甲基化組的混合機率模型和矩陣分解模型,求解出不同亞群在混合組織中所占的比例和其特異性甲基化區域,開發相關套用算法。項目開展期間,我們開發了基於DNA甲基化450K晶片數據的腫瘤純度估計方法InfiniumPurify,利用廣義最小二乘方法提出了考慮腫瘤純度的差異甲基化分析方法InfiniumDMC,利用最大似然估計方法提出了考慮純度信息的腫瘤樣本聚類方法InfiniumClust。針對腫瘤異質性分析問題,我們提出了基於部分參考信息的腫瘤異質性分解算法PREDE(Partial REference Deconvolution algorithm),並研究了其在腫瘤免疫學研究中的套用,發現了一些免疫細胞類型和癌症細胞類型,其在腫瘤組織中的組成成分與腫瘤樣本的生存率顯著相關。在本項目的資助下,已發表SCI論文9篇,其中Genome Biology (IF=13.214) 兩篇,Bioinformatics (IF=5.481) 一篇,PLoS Computational Biology (IF=3.955) 一篇等,從數量和質量上均超額完成預定目標。 在人才培養指標上,在本項目的資助下,課題組共畢業博士生3名,研究生5名,順利完成了預定目標。準確估計腫瘤異質性的程度,包括腫瘤組織中所包含的細胞亞群、各細胞亞群的分子標籤及其在腫瘤組織中所占的比例,對於理解腫瘤發育和轉移的分子機理,並進而設計有效的臨床治療方案具有重要的意義。