內容
1998年,
克萊格·凡特的塞雷拉基因組公司成立,而且宣布將在2001年完成測序工作。隨後國際團隊也將完成工作的期限提前。2000年6月26日,塞雷拉公司的代表凡特,以及國際合作團隊的代表弗朗西斯·柯林斯(Francis Collins),在美國總統
柯林頓的陪同下發表演說,宣布
人類基因組的概要已經完成。2001年2月,國際團隊與塞雷拉公司,分別將研究成果發表於《
自然》與《
科學》兩份期刊。在基因組計畫的研究過程中,塞雷拉基因組使用的是
鳥槍法測序(shotgun sequencing),這種方法較為迅速 ,但是仍需以傳統測序來分析細節。全基因組測序技術主要包括第二代測序技術(NGS)和第三代測序技術。第二代測序技術已經能夠快速、低成本的進行全基因組測序,其設備供應商主要是Solexa (現被Illumina公司合併),454(羅氏公司)和SOLiD(AB公司)。第三代測序技術於2011年4月正式推廣,其單分子實時(SMRT)測序技術完全不同與第二代測序,它的序列讀長高達3000 bp(Pacific Biosciences 公司研發)。
2015年10月24日,中國深圳--在第十屆國際基因組學大會(ICG-10)上,華大基因發布了其自主研發的新型桌面化測序系統 BGISEQ-500。該儀器是華大基因繼今年6月推出“超級測序儀”―Revolocity™之後的第二款測序系統。BGISEQ-500是一套小巧的集成式桌面測序解決方案,具有精準、簡易、快速、靈活、經濟的特點。該系統基於原有CG技術基礎最佳化而成,個人基因組檢測精度達到了99.99%,可以達到臨床需求。
該測序儀的樣品製備和測序操作都可通過配件自動完成,配備了無線射頻識別(RFID)的樣本追蹤系統,可監控並記錄實驗全流程,結合其簡潔的觸控式操作界面,可真正實現一鍵測序。對於臨床使用,可以通過其內置的套用軟體直接生成分析報告,從DNA樣本到數據分析結果的全過程最快可在24小時內完成。
技術路線
提取基因組DNA,然後隨機打斷,電泳回收所需長度的DNA片段(0.2~5Kb),加上接頭, 進行DNA簇(Cluster)製備,最後利用Paired-End(Solexa)或者Mate-Pair(SOLiD)的方法對
插入片段進行測序。然後對測得的序列組裝成Contig,通過Paired-End的距離可進一步組裝成Scaffold,進而可組裝成染色體等。組裝效果與
測序深度與覆蓋度、測序質量等有關。常用的組裝有:SOAPdenovo、Trimity、Abyss等。
測序指標
深度
測序深度(Sequencing depth)是指測序得到的鹼基總量(
bp)與基因組大小的比值,它是評價測序量的指標之一。測序深度與基因組覆蓋度之間是一個正相關的關係,測序帶來的錯誤率或假陽性結果會隨著測序深度的提升而下降。測序的個體,如果採用的是雙末端或Mate-Pair方案,當測序深度在50X~100X以上時,基因組覆蓋度和測序錯誤率控制均得以保證,後續序列組裝成染色體才能變得更容易與精準。
覆蓋度
測序覆蓋度:基因組被測序得到的鹼基覆蓋的比例;測序覆蓋度是反映測序隨機性的指標之一;測序序深度與覆蓋度之間的關係可以過Lander-Waterman Model(1988)來確定。當深度達到5X時,則可覆蓋基因組的約99.4%以上。
測序套用
通過
生物信息手段,分析不同
個體基因組間的結構差異,同時完成SNP及基因組結構注釋。 DNA突變可誘發癌症。吸菸過程中所釋放的>60種致癌化學物質可與DNA結合併對DNA鏈上的
鳥嘌呤和腺嘌呤進行
化學修飾從而產生大的加合物,該加合物改變了DNA雙螺旋的結構,如果不被
核苷酸剪下修復或其他的途徑進行糾正,那么DNA在複製時就會按照non-Watson-Crick方式進行複製並阻止RNA聚合酶進行轉錄,從而引發癌症。英國
劍橋大學和Wellcome Trust Sanger研究所一起,於2010年初,在Nature雜誌上發表文章,他們用第二代測序技術(ABI SOLiD)對一個小細胞肺癌(Small-cell lung cancer, SCLC)
細胞系NCI-H209基因組進行測序,以探討煙氣中的致癌物質引發了該細胞系基因組中哪些特定鹼基及其周圍序列的突變及細胞損傷修復路徑。
研究結果
①NCI-H209細胞系基因組中,共檢測到22,910個
鹼基替換、65個插入缺失(Indels)、58個結構變異;在基因組的
編碼區,除了發現RB1 和TP53基因發生
點突變和MLL2基因由於發生了G>T的顛換,從而產生了pre-stop codon外,有94個點突變直接改變了胺基酸序列,有36個屬
同義突變。
②特定的鹼基及其周圍序列易被煙氣中的多環芳烴和丙烯醛誘變。在NCI-H209細胞系基因組中,G>T/C>A是最為普遍的
顛換現象,發生頻率為34%;其次是G>A/C>T(21%)和A>G/T>C(19%);CpG島外的CpG二
核苷酸多發生G>T顛換,而CpG島內的CpG二核苷酸多發生G>C顛換,說明煙氣中的致癌物偏好引起
甲基化的CpG二核苷酸發生顛換。
③檢測到轉錄偶聯修復(Transcription-coupled repair)和表達相關的修復(Expression-linked repair)在起作用。轉錄偶聯修復作用機制:鳥嘌呤和腺嘌呤上大的加合物是吸菸過程中所釋放的致癌化學物質引起DNA損傷的主要形式,這些大的加合物阻止了
轉錄鏈上RNA聚合酶的轉錄過程,而轉錄受阻的RNA聚合酶招募核苷酸剪下修復相關因子對受損的核苷酸進行修復以避免突變發生。在TP53
基因突變的肺癌細胞中,G>T顛換常出現在非轉錄鏈,表明在轉錄鏈上相同的損傷已被識別和修復。在本研究中,轉錄鏈上G和A
鹼基替換頻率比非轉錄鏈上少,由此看來
嘌呤是煙氣致癌物質主要誘變靶標。另外,在NCI-H209細胞系中,轉錄鏈和非轉錄鏈上發生不同類型的突變(G>T、A>G、A>T)兩條鏈基因表達水平也有差異,這就意味著轉錄偶聯修復機制識別、修復不同加合物損傷的能力不同。
表達相關的修復(Expression-linked repair)作用機制:這是一種新的、更為普遍的修復機制,即,高表達的基因中,
轉錄鏈及非轉錄鏈的
突變頻率都較低。在NCI-H209細胞系中,轉錄鏈和非轉錄鏈上發生G>A的突變,兩條鏈上基因表達水平都很高,這就說明表達相關的修復作用比轉錄偶聯修復作用更為重要。
④在SCLC細胞系中,CHD7基因發生了重排。在NCI-H209細胞系中,CHD7基因3~8
外顯子發生連續重複,而另外2個LU-135、NCI-H2171細胞系則攜帶PVT1-CHD7
融合基因,說明在肺癌中CHD7基因發生了周期性重排。
以上結果表明,第二代測序技術已成為研究與癌症相關的基因突變過程、細胞損傷修復路徑、
基因調控網路的強有力工具。