DNA與蛋白質作用的全基因組分析

《DNA與蛋白質作用的全基因組分析》是依託東南大學,由陸祖宏擔任項目負責人的面上項目。

基本介紹

  • 中文名:DNA與蛋白質作用的全基因組分析
  • 項目類別:面上項目
  • 項目負責人:陸祖宏
  • 依託單位:東南大學
中文摘要,結題摘要,

中文摘要

新一代DNA測序技術的出現給在全基因組水平上開展DNA和蛋白質相互作用的研究帶來了重大的機遇。本項目旨在發展基於新一代高通量DNA測序技術的DNA和蛋白質相互作用的研究平台,使之能夠在全基因組水平上進行特定組織和細胞中轉錄因子等DNA結合位點的檢測,以及開展相關基因表達調控網路的研究。針對目前新一代測序技術存在的樣品需求量大、成本偏高、測序文庫的製備存在一定偏性等問題,本項目將套用納米纖維材料、生物編碼技術以及滾環擴增技術等方法,爭取發展一個能夠針對微量樣本(10納克級DNA)、成本較低的新一代DNA測序平台,用於DNA與蛋白質相互作用的全基因組檢測,並發展相應的生物信息學分析方法,開展基於DNA和蛋白質相互作用的基因表達調控網路分析和研究,針對至少10類重要的轉錄因子,研究其在5種腫瘤相關的細胞系、或腫瘤組織、或相關的幹細胞等體系中DNA和蛋白質的相互作用和基因調控網路。

結題摘要

本項目成功構建了基於ERG1和Jun的ChIP-Seq方法和改進的MeDIP-Seq全基因組甲基化分析方法。在樣本的測序文庫構建方面進行了改進和最佳化實驗研究,發展了相應的生物信息分析方法。針對白血病K562細胞系,研究了該細胞系在佛波醇和血紅素等刺激下基因調控網路的變化規律。通過對K562細胞系中ERG1的ChIP-Seq數據分析,共得到了3.67M唯一匹配到基因組上的序列,共鑑定了13703個富集峰。其中11595個在TSS和TES 位點5kb以內,約占84.6%,發現有5162個富集峰位於基因的TSS上游和下游1kb,占整個峰數目的37.7%。考慮到同一基因內或附近可有多個ERG1的結合位點,共鑑定出與ERG1相關的基因3602個;在14,880個注釋的長鏈非編碼lncRNA中,570個lncRNA的附近(TSS和TSE的5000bp以內)有EGR1的結合富集峰。其中240個結合在lncRNA的TSS 1000bp以內。在microRNA轉錄起始位點1kb以內的富集峰,發現有38個EGR1富集峰位於microRNA的TSS 1kb以內。研究揭示在PMA誘導的K562細胞分化過程中EGR1及眾多的EGR1的靶基因的表達發生了變化,說明EGR1很有可能是這一過程的關鍵調控因子。通過對K562細胞系中的MeDIP-Seq數據進行分析,該數據覆蓋了近60.8%的人類基因組區域,表明MeDIP-Seq能夠較好地獲得全基因組DNA甲基化圖譜;識別出約140000個不短於500bp的甲基化區域,但是95.2%的基因顯示為非甲基化或低甲基化,只有873個基因的啟動子區域顯示有甲基化片段信號。分析了DNA甲基化和CpG位點密度的關係,結果表明DNA甲基化趨向於分布在中等CpG密度區域而非高CpG密度區域。DNA甲基化更趨向於分布在基因3’末端和基因間區,而非基因的5’末端。本項目的研究為深入認識K562細胞的基因調控網路提供了多層尺度的組學信息,為進一步進行K562基因調控網路的跨平台組學分析打下了基礎。

相關詞條

熱門詞條

聯絡我們