《PDP-PEG-Biotin化學小分子輔助測序實現棉花基因組精細結構》是依託武漢大學,由吳志國擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:PDP-PEG-Biotin化學小分子輔助測序實現棉花基因組精細結構
- 項目類別:青年科學基金項目
- 項目負責人:吳志國
- 依託單位:武漢大學
項目摘要,結題摘要,
項目摘要
高等植物基因組的精細結構,是研究功能基因以及分子機制的基礎。棉花細胞染色體端粒以及基因組中富含G的序列在測序過程中PCR擴增效率遠低於隨機序列,導致在序列組裝時產生大量的gap。本項目結合化學與生物學的方法,可能對富含G序列分離測序從而實現棉花基因組的精細結構。化學合成生物素標記的有機小分子(PDP-PEG-Biotin),特異性的識別棉花基因組中富含G的序列,由鏈酶親和素磁珠分離富集,並進行第三代SMRT測序。再將富含G的序列組裝拼接到棉花基因組草圖,得到棉花基因組精細結構,進而解析隱匿在端粒區的功能基因。本項目基於基因組DNA的二級結構,套用化學小分子將測序中擴增效率低的片段分離富集,從而實現棉花基因組的精細結構。化學小分子輔助測序手段的加入,可能大大提高動植物基因組的解析度,提高大基因組測序組裝的完整性和準確度。
結題摘要
真核細胞基因組中富含鳥嘌呤的序列在測序過程中PCR擴增效率遠低於隨機序列,導致基因組序列拼接的不完整。本項目結合化學與生物學的方法,對富含鳥嘌呤的人類以及棉花基因組序列富集測序從而實現基因組功能區域的精細解析。化學合成了一個柔性鏈連線的有機小分子化合物PDP-PEG-Biotin,特異性的識別並富集細胞中富含鳥嘌呤的DNA序列,經高通量測序鑑定到五萬個潛在的G四鏈體位點。用該小分子孵育HEK 293T細胞72小時,觀測到超過四千個基因表達顯著上調或下調。預示該小分子具有通過結合G4結構調控活細胞內基因表達的活性。綜合第三代長讀長測序技術PacBio,HiC以及Illumina seq對雷蒙德氏棉(D5)的基因組進行了重新測序組裝,13條染色體級別序列長度達到783Mb,Contig N50達到6.2Mb,Scaffold N50達到了58.4Mb,共有20個完整端粒結構得到了確定。47%的D5基因組序列為LTR/TE,並且通過高斯機率密度方程計算得到TE的爆發時間為5.7百萬年前。計算發現亞洲棉基因組中Ty1類型轉座子集中在最近三十萬年內爆發,通過高通量轉錄本測序比對找到Ty1類轉座子仍然在表達的IN和RT蛋白結構域。Chip-qPCR實驗證實Ty1類轉座酶結合在亞洲棉和陸地棉部分功能基因的第一個外顯子上,預示著轉座酶具有調控棉花基因表達的新的活性。