包含重複序列的基因預測及其功能分析

包含重複序列的基因預測及其功能分析

《包含重複序列的基因預測及其功能分析》是依託上海交通大學,由韋朝春擔任項目負責人的面上項目。

基本介紹

  • 中文名:包含重複序列的基因預測及其功能分析
  • 項目類別:面上項目
  • 項目負責人:韋朝春
  • 依託單位:上海交通大學
項目摘要,結題摘要,

項目摘要

重複序列區域占人類基因組總長度的50%以上,包含蛋白質編碼基因,疾病相關位點以及其他功能因子。現有研究表明,人類基因組個體差異的絕大部分在重複序列區域,其中拷貝數變異(CNV)區域占70%以上。目前已經有很多基於CNV區域基因的疾病研究。這些研究都是以參考基因資料庫Refseq為標準進行的。然而由於CNV區域包括大量重複序列,CNV區域的Refseq注釋非常不完整,其原因是現有的基因預測系統需要先將重複序列區域禁止,然後再進行預測。.本項目將針對重複序列區域特點開發一個基因預測系統,對包括人類基因組在內的重複序列區域進行精細化的基因預測和分析。根據本項目前期研究基礎,估計會預測到幾百個沒有包括在現有資料庫的人類基因。本項目將挑選其中的部分基因驗證其存在性並進一步分析其功能。本項目將生成一個更完整的參考基因集合,對基於CNV區域基因的疾病研究以及重複序列的功能研究具有比較重要的意義。

結題摘要

本項目旨在針對人類基因組中重複序列區域的特點開發一個基因預測系統,對包括重複序列的基因組區域進行精細化的基因預測和分析。本項目將生成一個更完整的參考基因集合,對基於CNV區域基因的疾病研究以及重複序列的功能研究具有比較重要的意義。主要研究內容包括: 1. 開發一個針對包括CNV等重複序列區域的基因預測系統;2.和現有的基因結構進行比較,得到新發現的基因;選擇100個左右的基因結構,設計實驗驗證其存在性;3. 將系統套用推廣到其他富含重複序列的基因組,如牛基因組或玉米基因組。考核指標包括,發表2-3篇高影響因子的論文;參加多次國內/國際學術交流會議;培養研究生2-4人。本項目完成情況如下。1、開發了人類基因可變剪下預測系統ALTSCAN,預測了蛋白質編碼基因的可變剪下;整合轉錄組學和蛋白質組學實驗數據驗證得到近3萬個公共資料庫中沒有的新轉錄本;其中737個新轉錄本來自570個包括L1重複序列的基因;從所有新轉錄本中隨機抽取98個,PCR實驗表明近85%的新轉錄本在48個人體組織或細胞系中至少一個中有表達;在此基礎上預測人類蛋白質的數量不低於20萬個。 相關論文2015年6月發表在Scientific Reports(影響因子5.23)。 2、分析比較了包括重複序列和不包括重複序列的基因的表達水平;發現了一般情況下重複序列所在基因的表達水平相對較低;但是重複序列對所在基因表達量的影響和重複序列在基因中的位置有關;相關工作目前投稿中。3、將包括重複序列的基因的預測方法推廣到水稻基因組,發現水稻的不同個體中基因的數量有較大差異,相關結果2016年12月線上發表在Nucleic Acids Research(影響因子9.20)。 本項目相關的工作還包括二代測序數據分析系統及方法的開發。已經發表標註本項目資助的SCI論文5篇,影響因子5以上2篇。 培養碩士研究生9人(5人畢業,包括1人國際聯合培養);博士生2人(1人畢業)。參加國際會議交流5人次。 綜上所述,本項目取得了比較豐富的研究結果,超額完成了大部分考核目標。

相關詞條

熱門詞條

聯絡我們