《擬南芥基因轉錄調控關係的識別方法研究》是依託上海師範大學,由鄭小琪擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:擬南芥基因轉錄調控關係的識別方法研究
- 項目類別:青年科學基金項目
- 項目負責人:鄭小琪
- 依託單位:上海師範大學
項目摘要,結題摘要,
項目摘要
轉錄調控關係的識別是理解基因轉錄調控機理的重要環節。染色質免疫共沉澱實驗和微陣列技術是識別轉錄因子靶基因的兩類實驗方法,然而它們普遍存在費用高、無法實現高通量識別等缺陷。因此,開發有效的計算預測方法具有重要的實際意義。本項目以模式植物擬南芥為研究對象,以現有的轉錄調控關係和基因表達數據為基礎,利用計算數學、生物信息學的工具開發擬南芥轉錄因子結合位點和調控關係識別的新方法。內容包括:(1) 研究基因共調控與共表達、功能相似性等之間的關係,改進現有的擬南芥基因共調控聚類方法,並通過motif識別工具的比較與整合,提高對擬南芥motif識別的準確性;(2) 研究轉錄因子與其靶基因的表達模式關係,綜合提取表達譜、序列及結構信息構建擬南芥轉錄因子-靶基因預測的機器學習模型,得到高可信的motif和轉錄調控數據,並進行實驗驗證。本項目可以為理解擬南芥轉錄調控機理、構建基因調控網路提供理論基礎。
結題摘要
至2014年12月止,課題組成員已發表相關SCI論文13篇,另有在投及接收論文3篇。其中影響因子在10.0以上的有1篇,3.0以上的7篇。2012年12月至2014年2月,項目負責人赴哈佛大學生物統計與計算生物學系劉曉樂教授課題組進行了為期一年多的學術訪問,共同完成高水平研究論文一篇,並確定了長期的合作關係。共培養博士生1名 (於曉慶),碩士生5名(唐琳燕、張君麗、張程、周昶捷、臧東巧)。本項目的主要研究結果包括: 1)擬南芥基因轉錄調控關係識別方面。我們利用統計學習方法,建立了擬南芥基因“轉錄因子-靶基因”的預測模型,該模型以基因表達譜、啟動子序列特徵為輸入,利用支持向量機方法進行識別,得到了令人滿意的準確度,也得到了新的高可信的轉錄調控關係以供試驗驗證。 2)腫瘤組織甲基化與異質性的研究。刻畫出腫瘤組織與其癌旁正常組織的甲基化圖譜,並進而進行比較是目前癌症表觀遺傳研究的核心內容之一。我們建立了癌症-正常混合組織以及癌症多亞群落組織甲基化組的機率模型,並利用極大似然估計和EM算法對模型進行了求解。利用該模型,我們僅通過腫瘤組織的甲基化組數據就可以推測組織中腫瘤細胞的純度和差異甲基化區域,從而大大降低了差異甲基化分析的實驗工作量,並同時提高差異甲基化區域識別的準確性。該成果近期發表在生物學著名期刊《Genome Biology》上。 3)在疾病相關基因預測方面,我們利用蛋白質互作網路、疾病基因關聯網路和疾病表型相似性數據構建了疾病與基因關係的多尺度整合網路模型,然後提出了一個基於“有返回隨機遊動”和“整體拓撲相似性”的致病相關基因預測方法。該方法在交叉驗證和從頭預測方法均取得了較好的效果。該論文已經發表在計算生物學重要期刊《BMC Bioinformatics》上。 4)蛋白質結構分類、亞細胞定位、功能等方面的研究。我們首次提出利用蛋白質同源比對譜PSI-blast得到的PSSM矩陣出發,分別利用自協方差變化,LPC分解等工具提取特徵,既考慮了蛋白質序列中胺基酸次序的信息,也利用了其同源比對譜中蘊含的進化信息。 該方法對包括蛋白質二級結構類預測、凋亡蛋白亞細胞位點預測等模式分類問題上都取得了較好的識別效果。