基於數據整合的計算癌症基因組學研究

基於數據整合的計算癌症基因組學研究

《基於數據整合的計算癌症基因組學研究》是依託中國科學院數學與系統科學研究院,由張世華擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於數據整合的計算癌症基因組學研究
  • 項目類別:面上項目
  • 項目負責人:張世華
  • 依託單位:中國科學院數學與系統科學研究院
項目摘要,結題摘要,

項目摘要

癌症是一種複雜的基因疾病,其發生與細胞內的DNA序列以及表觀特徵的變異有關。但是目前對癌症的致病機理、臨床指標和藥物敏感性的預測等方面,仍然認識有限。隨著腫瘤基因組計畫等大型工程的進行,海量數據正不斷產生,如何有效地分析和利用這些數據,已經成為生物信息學的核心問題。不同層次癌症組學數據的大量積累,使得整合多重數據來更準確地研究癌症相關的基本問題已經成為可能。本項目將利用模式識別、機器學習、最最佳化、圖論等方法,研究如何整合多重不同屬性的癌症高通量數據來探討癌症基因組學領域的四個核心問題:驅動通路識別問題、癌症亞型識別問題及其致病機理的異同分析、癌症臨床指標預測及預測效果的評估研究和癌細胞系藥物敏感性預測問題。研究重點是,提出合理的數據整合模型和有效的大規模求解算法,揭示相關的生物學機理。本項目的研究不僅可以為生物學家提供可靠的計算方法和高效的軟體,而且可以推動計算理論和算法設計等的研究。

結題摘要

癌症是一種複雜的基因疾病。目前對癌症的致病機理、臨床指標和藥物敏感性的預測等方面,仍然認識有限。隨著腫瘤基因組計畫等大型工程的進行,海量數據正不斷產生。如何有效地分析和利用這些數據,已經成為生物信息學的核心問題。本項目的主要研究內容是利用模式識別、機器學習、最最佳化、圖論等方法,探索如何整合多重不同屬性的癌症高通量數據來探討癌症基因組學領域的四個核心問題:驅動通路識別問題、癌症亞型識別問題及其致病機理的異同分析、癌症臨床指標預測及預測效果的評估研究和癌細胞系藥物敏感性預測問題。本項目順利進行,發表SCI論文25篇,多篇文章投稿中。兩篇工作發表於重要期刊Nucleic Acids Research (2016年影響因子為10.16);三次被邀請在Springer出版的Methods in Molecular Biology撰寫關於癌症基因學主題的綜述和方法推介。 本項目取得一系列進展,比如提出了一種新的最佳化模型,能快速找到在癌症基因組上同時變異的多個通路,為研究多個驅動通路在癌症的發病過程中可能起協同作用提供了一種有效的手段。提出了兩種最佳化模型,以重新發現多種癌症類型的常見驅動基因集合和一種或多種癌症類型的特定驅動基因集合。研究了癌症細胞系表達譜與藥物敏感譜數據中的藥物-基因協同模式,開發了基於稀疏-網路正則化的偏最小二乘模型和算法來識別藥物-基因協同模式。深入研究了不同細胞系的DNA甲基化數據的分析和針對癌症異質性,結合DNA甲基化數據的Pan-cancer數據分析,揭示了非常豐富的生物學特徵。 項目主持人獲得多項榮譽或獎項以及項目的支持,其中包括國家自然科學基金“優秀青年”基金(2014年8月);中國科學院“卓越青年科學家”項目(2014年8月);鐘家慶運籌學獎(2015年7月)、中科院前沿科學研究重點計畫--拔尖青年科學家項目(2016年8月)、國家自然科學基金中新國際合作與交流項目(2016年12月)、國家萬人計畫青年拔尖人才計畫(2017年10月); 教育部自然科學二等獎(排名第三)(2017年11月)。

相關詞條

熱門詞條

聯絡我們