基於生物信息計算的核小體定位動態機制研究

《基於生物信息計算的核小體定位動態機制研究》是依託復旦大學,由周水庚擔任項目負責人的面上項目。

基本介紹

  • 中文名:基於生物信息計算的核小體定位動態機制研究
  • 依託單位:復旦大學
  • 項目類別:面上項目
  • 項目負責人:周水庚
項目摘要,結題摘要,

項目摘要

核小體是染色質的基本組元,由DNA纏繞在組蛋白八聚體上構成。核小體定位系指組蛋白八聚體在DNA 雙螺旋上的精確位置,它與基因轉錄、DNA複製和修復等基本生命過程密切相關。發現核小體定位的機制是一項具有重要學術價值的挑戰性課題。目前,人們主要基於組蛋白對DNA偏好性等靜態因素研究核小體定位機制,而DNA序列偏好性並不能解釋細胞在不同生理狀態下核小體定位的差異。隨著高通量實驗技術的發展,不同生物、同一生物的不同細胞、同一細胞的不同生理狀態等情況下的核小體分布數據越來越多,為探究核小體定位的動態影響因素創造了條件。本課題將集成不斷湧現的核小體定位數據,基於生物信息計算,研究影響核小體定位的動態因素(如 DNA 甲基化、組蛋白修飾、染色質重塑因子和轉錄因子、染色質高級結構等),探索它們是如何協同調控核小體定位,從而揭示核小體定位的動態機制,建立更準確的核小體定位預測模型。

結題摘要

本課題旨在集成不斷湧現的核小體定位數據,基於生物信息計算,研究影響核小體定位的動態因素(如 DNA 甲基化、組蛋白修飾、染色質重塑因子和轉錄因子、染色質高級結構等),探索它們是如何協同調控核小體定位,從而揭示核小體定位的動態機制,建立更準確的核小體定位預測模型。本項目主要工作與成果包括: (1)將蛋白質相互作用網路和DNA甲基化水平的方差變異信號納入EWAS研究中,通過貪婪算法在PPI網路上尋找緻密模組,使得這些緻密模組中DNA甲基化的均值變異和方差變異的合併信號較強的基因的比例較高。通過對模擬數據和真實癌症數據的研究發現,新方法優於現有所有方法。 (2)對目前已有的基於序列的核小體定位方法進行了比較全面、深入的比較分析。結果表明:Segal V2 和V3相對於其它方法比較穩定。同時,用已有方法在酵母、小鼠、果蠅和人的基因、啟動子及5’端非翻譯區進行實驗,發現:隨著物種的進化,連結區和綁定核小體的DNA序列的保守性逐漸降低。 (3)提出基於狄利克雷過程混合模型的核小體定位算法DPNuc。根據測序讀段位置信息分別在DNA正負鏈上建立狄利克雷過程混合模型,利用馬爾可夫鏈蒙特卡洛模擬、核密度估計確定模型參數,獲得核小體的左右邊界及“支持讀段”。最後,對左右邊界進行匹配,根據給定的最大重疊率對初步得到的核小體進行合併,同時根據左右邊界的“支持讀段”,估算核小體的大小、模糊度和權重。實驗結果表明新算法優於已有方法。 (4)系統的分析了酵母細胞全基因組上多種基於序列的特徵,包括大量的序列組成特徵和十二個結構特徵。通過計算每個特徵和核小體密度之間的相關性,識別那些和核小體形成具有高度相關性的特徵,然後將這些特徵集成到多層感知器模型上,並用於核小體密度的預測。利用預測得到的核小體密度曲線,進一步使用峰值檢測的方法來定位核小體的位置。結果表明選擇的這些特徵在核小體預測上有很好的效果,也證明了DNA序列本身對核小體形成的重要的影響作用。

相關詞條

熱門詞條

聯絡我們