專利背景
合成生物學的一個關鍵技術問題是低成本、高通量的基因合成和蛋白質表達的精確調控。截至2012年3月,人工合成基因的主要方法是將短鏈的寡核苷酸進行拼接和組裝得到長鏈的DNA。使用化學方法人工合成短鏈寡核苷酸的方法成本高,每
核苷酸約需人民幣0.6元,且合成錯誤率高,100個鹼基中出現一個鹼基缺失,400個鹼基中約有一個鹼基錯配和插入。因此,利用寡核苷酸組裝來合成基因或基因組的成本十分昂貴,且合成累積的錯誤率很高。通過克隆測序和突變的方法來修復錯誤會進一步增加工作量和總成本。
在微流晶片上進行大規模平行合成寡核苷酸合成可以顯著的降低成本。截至2012年3月,在晶片上合成寡核苷酸的方法主要包括噴墨列印(Agilent公司)、5’端修飾光敏保護基團(Nimblegen/Affmetrix公司),光照生成酸脫保護(Atactic/Xeotron)和電化學方法(Oxamer/Combimatrix公司)。但是,由於微流晶片的表面積非常小,寡核苷酸合成產量低,溶液中每種序列的寡核苷酸濃度為10-12摩爾或更低,因此,在組裝成基因之前還需進行大量擴增。2012年3月之前可行的方法是通過化學或酶解處理將合成出的寡核苷酸從微流晶片上釋放下來,經PCR擴增、限制性酶消化和純化後,得到的寡核苷酸用來組裝成基因或基因組,而合成基因的錯誤修複方法主要採用聚丙烯醯胺凝膠電泳、高效液相色譜分離。因此,2012年3月之前基因合成和錯誤修復的步驟依然繁瑣,迫切需要提高其集成化、微型化程度,顯著降低成本,並提高合成和錯誤修復效率。
發明內容
專利目的
《一種基因合成方法、基因晶片及試劑盒》旨在提供一種高通量、高保真、低成本的基因合成方法,將擴增寡核苷酸庫和平行組裝基因步驟整合到一塊微流晶片上同時進行;採用錯配特異性內切酶建立高效的基因合成錯誤修復體系,使合成錯誤率由每千鹼基對(鹼基對)約1.9個錯誤鹼基降至低於0.19個錯誤鹼基,成本為最低成本的十分之一。
技術方案
《一種基因合成方法、基因晶片及試劑盒》提供的一種基因合成方法,在一張基因晶片上採用恆溫刻痕和鏈位移擴增及聚合酶拼接反應進行寡核苷酸擴增以及基因組裝,所述基因晶片通過將寡核苷酸固定在固相載體表面形成,寡核苷酸的3’端具有長度為15-150個鹼基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在晶片表面。
優選地,所合成基因的長度大於或等於200個
鹼基對。
優選地,還包含並採用錯配特異性內切酶進行基因合成錯誤修復步驟。
優選地,寡核苷酸擴增以及組裝、基因合成錯誤修復三種反應在同一體系中先後連續進行或分步進行。
優選地,基因合成錯誤修復反應在晶片上或晶片外單獨進行。
優選地,所述基因晶片可以劃分成一個或多個區域,寡核苷酸擴增以及基因組裝在一個或多個區域同時進行。
優選地,所述恆溫刻痕和鏈位移擴增及聚合酶拼接反應是採用一條通用引物與寡核苷酸3’端的接頭雜交,在鏈移位聚合酶延伸並位移寡核苷酸鏈的同時,刻痕內切酶將通用引物從剛剛擴增出的寡核苷酸鏈上裂解下來,使通用引物的3’端重新游離,繼續開始新的延伸反應。
優選地,所述基因合成錯誤修復步驟為:通過熱變性,讓合成的基因重新退火,使錯配位點暴露,錯配位點被錯配特異性核酸內切酶和3’→5’核酸外切酶活性識別並切除,所得的基因片段經交疊延伸PCR反應組裝成完整基因。
該發明的另一個目的是提供一種基因晶片,所述基因晶片通過將寡核苷酸探針固定在固相載體表面形成,寡核苷酸的3’端具有長度為15-150個鹼基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在晶片表面。
優選地,所述基因晶片採用物理區隔的辦法,將微陣列分為子陣列,每一個子陣列中包含合成大於0.2鹼基對總長的寡核苷酸序列。
該發明的基因晶片所採用的固相載體選自任何可用於製備基因晶片的材料,包括但不限於,
硝酸纖維素膜、尼龍膜、玻璃片、矽片和塑膠片。該發明所述基因晶片的製備,是將所述的寡核苷酸有序地點樣到載體上,通過寡核苷酸的3’端接頭序列中的刻痕內切酶識別位點錨定,將寡核苷酸固定於載體上,從而製成基因晶片。
該發明還提供一種基因合成的試劑盒,包含上述任一項所述基因晶片、刻痕內切酶、鏈位移DNA聚合酶、高保真DNA聚合酶以及錯配特異性內切酶。
優選地,該發明所述試劑盒還包含dNTP、BSA、刻痕內切酶、鏈位移聚合酶、高保真DNA聚合酶及ThermopolII緩衝液和寡核苷酸引物,所述ThermopolII緩衝液由20摩爾/升Tris-HCl,10摩爾/升(NH4)2SO4,10摩爾/升KCl,2摩爾/升MgSO4,0.1%TritonX-100組成,其在25°C的pH為8.8。
該發明所述方法是基於DNA微陣列的高通量基因合成技術,採用物理區隔的辦法,將微陣列分為子陣列,每一個子陣列中僅僅包含合成大於0.2鹼基對總長的寡核苷酸序列,從而可以避免了序列的選擇性擴增,可以有效地合成所有的DNA序列,最後利用各子陣列中合成的總長DNA來組裝最終的DNA,避免相似序列之間交叉雜交而實現基因的有效組裝。 2013年5月之前大多採用化學方法對寡核苷酸序列進行處理使之脫離晶片繼而進行晶片外組裝反應。該發明首次採用了刻痕和鏈位移擴增反應從微陣列表面擴增寡核苷酸序列。也就是說,用於錨定序列於晶片表面的25-mer通用配體含有一個刻痕內切酶識別位點。寡核苷酸序列被合成後只需要加入刻痕內切酶就能催化序列的脫離從而進行序列組裝。
為了避免下游基因的組裝反應所需要的基因收集和純化的複雜操作,聚合酶循環組裝反應能在nSDA反應後直接進行而不需要更換緩衝溶液,實現了寡核苷酸序列的合成與組裝成基因片段在同一個小室中實現。通過使用一種特別的錯配特異性內切酶CEL酶減少了基因合成的錯誤,使基因合成的錯誤率達到了~0.19錯誤鹼基/鹼基對。
改善效果
《一種基因合成方法、基因晶片及試劑盒》的一種基於微流晶片技術的高通量、高保真基因合成方法,可大幅度降低了基因合成成本,顯著縮短了合成時間,極大地滿足生命科學前沿領域對大規模基因合成的迫切需求。
附圖說明
圖1是將寡核苷酸擴增和基因組裝過程整合到同一塊晶片上進行的全過程示意圖。
圖2是基因合成錯誤修復體系反應原理示意圖。
圖3顯示了套用該專利方法在晶片上合成出的lacZα密碼子變異基因在大腸桿菌中的表達情況。
a中顯示了將1,296個的表達不同lacZα密碼子變異基因的大腸桿菌菌落依顏色強度分類。
b中柱狀圖顯示了瓊脂平板上1,468種表達不同lacZα密碼子變異基因的隨機菌落顏色深度分布。
圖4顯示了使用該發明高通量、高保真晶片基因合成技術對蛋白質表達的最佳化結果。
圖a中列出了其中15種蛋白的數據。每對泳道顯示的均為大腸桿菌內的總蛋白,左側泳道為原生型(WT),右邊是最佳化後的克隆(Op)。箭頭標示的較粗的條帶是高度表達的原生型轉錄因子-GFP融合蛋白。泳道M是蛋白質分子量標準。
圖b中為餘下59中蛋白表達結果。
權利要求
1.一種基因合成方法,其特徵在於,在一張基因晶片上採用恆溫刻痕和鏈位移擴增及聚合酶拼接反應進行寡核苷酸擴增以及基因組裝,所述基因晶片通過將寡核苷酸固定在固相載體表面形成,寡核苷酸的3’端具有長度為15-150個鹼基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在晶片表面,所述恆溫刻痕和鏈位移擴增及聚合酶拼接反應是採用一條通用引物與寡核苷酸3’端的接頭雜交,在鏈移位聚合酶延伸並位移寡核苷酸鏈的同時,刻痕內切酶將通用引物從剛剛擴增出的寡核苷酸鏈上裂解下來,使通用引物的3’端重新游離,繼續開始新的延伸反應;所述刻痕內切酶是指只切斷DNA雙鏈中一條鏈的DNA
內切酶。
2.權利要求1所述的基因合成方法,其特徵在於,所合成基因的長度大於或等於200個鹼基對。
3.權利要求1所述的基因合成方法,其特徵在於,還包含並採用錯配特異性內切酶進行基因合成錯誤修復步驟。
4.權利要求3所述的基因合成方法,其特徵在於,寡核苷酸擴增以及組裝、基因合成錯誤修復三種反應在同一體系中先後連續進行或分步進行。
5.權利要求3所述的基因合成方法,其特徵在於,基因合成錯誤修復反應在晶片上或晶片外單獨進行。
6.權利要求1所述的基因合成方法,其特徵在於,所述基因晶片可以劃分成一個或多個區域,寡核苷酸擴增以及基因組裝在一個或多個區域同時進行。
7.權利要求3所述的基因合成方法,其特徵在於,所述基因合成錯誤修復步驟為:通過熱變性,讓合成的基因重新退火,使錯配位點暴露,錯配位點被錯配特異性核酸內切酶和3’→5’核酸外切酶活性識別並切除,所得的基因片段經交疊延伸PCR反應組裝成完整基因。
8.一種基因晶片,通過將寡核苷酸探針固定在固相載體表面形成,其特徵在於,寡核苷酸的3’端具有長度為15-150個鹼基的接頭序列且通過該接頭序列中的刻痕內切酶識別位點錨定在晶片表面。
9.根據權利要求8所述的基因晶片,其特徵在於,採用物理區隔的辦法,將微陣列分為子陣列,每一個子陣列中包含合成總長大於0.2鹼基對的
寡核苷酸序列。
10.根據權利要求8或9所述的基因晶片,其特徵在於,所述固相載體選自硝酸纖維素膜、尼龍膜、玻璃片、矽片和塑膠片。
11.一種基因合成的試劑盒,包含權利要求8-10任一項所述基因晶片、刻痕內切酶、鏈位移DNA聚合酶、高保真DNA聚合酶以及錯配特異性內切酶。
12.根據權利要求11所述的試劑盒,其特徵在於,還包含dNTP、BSA、ThermopolII緩衝液和寡核苷酸引物,所述ThermopolII緩衝液由20摩爾/升Tris-HCl,10摩爾/升(NH4)2SO4,10摩爾/升KCl,2摩爾/升MgSO4,0.1%TritonX-100組成,其在25°C的pH為8.8。
實施方式
《一種基因合成方法、基因晶片及試劑盒》提供的基因合成方法全過程示意圖見圖1,其中寡核苷酸擴增和基因組裝過程整合到同一塊晶片上進行。利用噴墨列印式DNA晶片合成儀或其它類型晶片合成儀在微流晶片上各個獨立的微池內合成寡核苷酸庫。然後向微池中加入組合好的擴增和組裝反應混合物並密封。在刻痕和鏈位移擴增反應(nSDA)中,鏈位移DNA聚合酶延伸並移位正在處理的鏈,同時刻痕內切酶將通用引物從合成出得寡核苷酸產物上切去,產生新的3′端並繼續延伸。擴增之後,每個微池中的游離的寡核苷酸通過聚合酶鏈式反應(PCR)組裝成基因產物。
為了使該領域的技術人員更好地理解該發明的技術方案,下面結合具體實施例對該發明作進一步的詳細說明,所述的實施例是對該發明的解釋而不是限定。
1″×3″的標準環烯烴共聚物(COC)薄片表面經矽薄膜修飾,整塊晶片表面被劃分成30個微池,每個微池的半徑為150微米,間距300微米(中心點之間的距離)以減少導致寡核苷酸合成不理想的邊緣效應。圖3是經二氧化矽薄膜修飾的微流晶片表面的微池陣列示意圖。
噴墨式合成寡核苷酸的方法是已知的。使用特製的噴墨式DNA晶片合成儀在經矽薄膜修飾的環烯烴共聚物(COC)晶片上合成寡核苷酸。寡核苷酸產物的長度設計為48或60個鹼基,其中3’端為一段長為25個鹼基的接頭序列。該接頭中含有一個刻痕內切酶(Nickingendonuclease)識別位點並將寡核苷酸錨定在晶片表面。晶片上每個微池內可以列印361個點,每個點上合成一種序列的寡核苷酸,每個微池內合成出的寡核苷酸將分別組裝成長度為大於0.2鹼基對的一條基因或一個基因庫。為提高產量,可於多個點上均合成同一種序列的寡核苷酸。
寡核苷酸在合成後,向晶片上的每個微池中加入恆溫刻痕和鏈位移擴增(Isothermal nicking and strand displacemen tamplification,nSDA)、聚合酶拼接(Polymerase chain assembly,PCA)組合反應所需的其他組分的混合物,該混合物中含有0.4摩爾/升dNTP、0.2毫克/毫升BSA、刻痕內切酶(Nt.BstNBI,購自美國NEB公司)、鏈位移DNA聚合酶(BstDNA聚合酶大片段,購自美國NEB公司)、高保真DNA聚合酶(Phusion聚合酶,購自美國NEB公司)及經最佳化的ThermopolIIbuffer(購自美國NEB公司)。將晶片上各微池密封后,將晶片置於Mastercycler梯度PCR儀(購自Eppendorf公司)的晶片適配器上進行nSDA-PCA組合反應。體系中首先進行nSDA反應,於50℃恆溫2hr後,升至80℃恆溫20分鐘;隨後進行PCA反應,於98℃預變性30秒後,進行40個循環的PCR反應,每個循環包括:98℃變性7秒,60℃退火60秒,72℃以15秒/鹼基對速度延伸,最後再於72℃延伸5分鐘。 在刻痕和鏈位移擴增反應(nSDA)中,一條通用引物與寡核苷酸3’端的接頭雜交,
DNA鏈位移聚合酶(strand-displacing polymerase)延伸並位移正在處理的寡核苷酸鏈,同時刻痕內切酶(nickingendonuclease)將通用引物從用於基因合成組裝的寡核苷酸上分離開來,並產生新的3’端用於進一步的延伸反應。
nSDA-PCA反應之後,各微池內1-2微升反應產物利用Phusion聚合酶和末端引物進行PCR擴增。末端引物濃度為0.5微米。PCR反應先於98℃預變性30秒後,進行30個循環的PCR反應,每個循環包括:98℃變性10秒,60℃退火60秒,72℃以30秒/鹼基對速度延伸,最後再於72℃延伸5分鐘。
擴增後,每個小池中的游離寡核苷酸通過聚合酶拼接(PCA)反應全部用來組裝成為基因產物。
該發明中使用植物CEL族的錯配特異性內切酶,可識別並裂解由鹼基取代或小插入或缺失導致的所有類型的錯配。CEL酶的一個商品化的亞型是Surveyor核酸酶(購自Transgenomic公司),在基因錯誤修復反應中,我們首先通過熱變性,讓合成的基因重新退火,使錯配位點暴露,然後用Surveyor核酸酶處理這些基因,錯配位點被錯配特異性核酸內切酶和3’→5’核酸外切酶活性識別並切斷。最後,所得的基因片段經交疊延伸PCR反應重新組裝成完整的基因。該修復過程可以重複進行,以提高修復率。經過兩輪修復,合成出的基因的錯誤可降低16倍以上,最終錯誤率約為每8700鹼基對中有一個錯誤鹼基。基因合成錯誤修復反應原理示意圖見圖2。
在片組裝的基因產物經PCR擴增並純化後,用1×Taq緩衝液(購自NEB公司)或1×PhusionHF緩衝液(購自NEB公司)稀釋至終濃度為50納克/微升,95℃預變性10分鐘後,逐漸降溫退火,先以2℃/秒的速率降溫至85℃,然後以0.3℃/秒的速率降溫至25℃,每隔10℃保溫1分鐘。反應產物(4微升,200納克)與0.5微升Surveyor核酸酶試劑和0.5微升增強劑(購自Transgenomic公司)混合,於42℃孵育20分鐘。反應產物進行交疊延伸PCR將因含有錯誤鹼基而被切斷的基因片段重新組裝成完整的基因。PCR反應先於98℃預變性30秒後,進行30個循環的PCR反應,每個循環包括:98℃變性10秒,60℃退火60秒,72℃以30秒/鹼基對速度延伸,最後再於72℃延伸5分鐘結束反應。
在第二輪錯誤修復中,將上一輪修復產物用1×Taq緩衝液稀釋至50納克/微升,重新退火,反應體系和條件都如前所述。反應產物進行交疊延伸PCR,所得產物即為經修復的完整基因。
在異丙基-β-D-硫代半乳糖苷(IPTG)存在下,lacZα的表達可使宿主大腸桿菌菌落呈現藍色。首先,參照非偏好性密碼子使用表,設計出一系列lacZα密碼子變異基因,在該表中對應同一種胺基酸的各種密碼子使用頻率相同。
之後,構建了一個lacZα密碼子變異基因庫,由1,296個的表達不同lacZα密碼子變異基因組成,並將其全部轉化到大腸桿菌感受態細胞中。取出一小部分塗布在瓊脂糖固體平皿上,並通過自動成像分析實時測定各個單克隆菌落的藍色深度。菌落顏色深淺的差別顯示著蛋白質表達水平不同。隨機挑選瓊脂糖固體平皿上的單克隆菌落進行統計,得到了關於密碼子變異基因表達水平的鐘形分布圖。大約三分之一的變異基因顯示出比原生型lacZα更高的表達水平。原生型基因的表達水平稍高於所有表達量可測的克隆的中等水平。
圖3顯示了套用該發明所述方法在晶片上合成出的lacZα密碼子變異基因在大腸桿菌中的表達情況。圖3a中顯示了將1,296個的表達不同lacZα密碼子變異基因的大腸桿菌菌落依顏色強度分類。原始圖片是使用HP Photo smart C7180平板掃瞄器對瓊脂平皿進行掃描獲得的。圖3b中柱狀圖顯示了瓊脂平板上1,468種表達不同lacZα密碼子變異基因的隨機菌落顏色深度分布。對幾百個藍色克隆的測序證實,由於晶片合成的密碼子變異基因庫很大,在一塊平板上得到相同克隆的幾率極低。原生型lacZα的表達水平用虛線表示。
儘管這種分布的原因尚需進一步研究,但通過該分布圖已能夠估計大腸桿菌中lacZα基因的潛在翻譯能力。這些實驗結果顯示出該發明公開的這種在晶片上合成基因的方法,實現了在給定的表達體系中篩選出具有可靠且理想的蛋白表達水平的基因序列,具有高度的可行性和可靠性。
為了直接測定蛋白質在大腸桿菌中的表達水平,在每種目標基因上加上綠色螢光蛋白(GFP)報告基因標籤。蛋白質表達水平越高,該單克隆菌落髮出的螢光越強。
該發明套用對74種果蠅轉錄因子蛋白的結構域進行了表達的最佳化和篩選,這些蛋白是被用於製備ENCODE工程(DNA元件的百科全書)的抗體。首先,針對15種在大腸桿菌中不表達的候選基因,並根據大腸桿菌密碼子使用表,設計並套用該發明公開的晶片基因合成方法合成了密碼子變異基因庫。在此套用中,沒有使用錯配內切酶錯誤修復體系,因為非常相關的密碼子變異基因之間可能會形成異類雙鏈DNA。合成出的基因與GFP的N端融合,並使用非序列依賴型的聚合酶循環延伸克隆的方法(CPEC)插入到pAcGFP表達載體中。質粒轉化到大腸桿菌細胞內,在瓊脂平板上培養。持續監測所有菌落髮出的螢光,螢光很強的部分克隆被挑選出來進行測序。所有克隆中所含有的質粒,帶有不同密碼子變異基因的,貫穿了候選蛋白的序列。
將序列已確定的、螢光較強的克隆於液體培養基中培養,在聚丙烯醯胺凝膠上對總蛋白提取物進行電泳以確定蛋白結構域的表達情況。使用這種方法,15種候選蛋白均篩選得到具有高表達量的克隆。相比之下,克隆到相同的載體中,並在相同的條件下培養的原生型對照組檢測不到蛋白表達量。這種結果表明,該發明公開的晶片基因合成方法能夠可靠地從不可檢測的水平將蛋白質的表達量提高到占細胞中蛋白總質量的50-60%。 圖4顯示了使用高通量、高保真晶片基因合成技術對蛋白質表達的最佳化結果。圖a中列出了其中15種蛋白的數據。每對泳道顯示的均為大腸桿菌內的總蛋白,左側泳道為原生型(WT),右邊是最佳化後的克隆(Op)。箭頭標示的較粗的條帶是高度表達的原生型轉錄因子-GFP融合蛋白。在原生型的泳道內,檢測不到有原生型轉錄因子-GFP融合蛋白被表達。每塊NuPage4-12%梯度膠上分離的細胞內總蛋白的量相同。用EZBlue凝膠染色試劑染色。泳道M是Novex預染蛋白質分子量標準混合物(購自Invitrogen公司)。
對其餘59種蛋白進行了相同的密碼子最佳化實驗。圖4b中為餘下59中蛋白表達結果。
本實施例74種果蠅轉錄因子基因片段經最佳化後在大腸桿菌中表達,針對每種基因片段均合成了大約1,000-1,500種密碼子變異基因,與GFP基因一起克隆到表達載體的開放閱讀框架中,經表達篩選出螢光最強的菌落。測序和蛋白凝膠電泳結果證實所測試的所有候選蛋白都如預期得到了高表達量的克隆。據此,可以再一次證實該發明的可行性和可靠性。
榮譽表彰
2017年6月22日,《一種基因合成方法、基因晶片及試劑盒》獲得安徽省第五屆專利獎金獎。