投入基因組計畫的經費很可觀,參加人員數量多,分布面廣,近兩年來,這方面的研究進展很快,本文將對擬南芥菜和水稻的基因組計畫的規劃及進展作一簡要介紹。
擬南芥菜基因組研究項目因為植物對於人類的衣食住行有著很大的關係,因此對植物分子生物學的研究往往集中於一些重要糧食作物如水稻、小麥等及經濟作物如油萊、
大豆等。有人曾對基因庫(GenBank)中有關植物的數據作了統計,其中有90%的DNA序列來自22種植物,而另外10%則來自於30種植物,這些研究一般都是針對某種植物的某個基因作的詳細研究[1]。而隨著研究的深入,植物學家越來越認識到對一個模式植物展開全面的分子生物學研究的重要性,因為隨著對一些模式生物,如大腸桿菌、果蠅及線蟲等的集中研究,越來越多的事實表明,對這些遺傳及基因組背景相對簡單的模式生物的研究將有助於人們對其他複雜的生物的研究及認識。基於這些事實,人們選中了一種毫無經濟價值的小草——擬南芥菜(Arabidopsis thaliana)作為模式植物。最早以擬南芥菜為實驗材料的是一些經典的遺傳學家,但近5年來,越來越多的植物分子生物學家和發育學家開始用它作為實驗材料,並於1990年形成了一個國際性合作研究計畫——擬南芥萊基因組研究項目。
擬南芥菜屬十字花科,擬南芥屬,是一種分布很廣的植物,它不僅基因組較簡單,即染色體n=5,核基因組DNA含量=1億鹼基對。而且生命周期短,種子產量大,即一代的時間為3~5周,每個植株可產生無數粒細小的種子,亦有人將之稱為植物中的“果蠅”。
1. 研究項目的組織及資助
擬南芥菜項目由多國科學家組成的委員會(MuItinationaI Science Streering Committee)統一協調。此計畫的總目標是找出擬南芥菜基因組中全部的基因,並將此植物基因組完全測序。
任何基因組研究工作所需經費將是巨大的,擬南芥菜項目經費將由參加國各自承擔。
北美方面,有四個美國國家機構支持此項研究:美國國家科學基金會(NSF)、能源部(DOE)、國立衛生研究所(NIF)和農業部(USDA),這四個機構在1990~1991年為此項目提供的經費達1500萬美元,其中45O萬是由國會為此計畫直接撥給NSF的。英國農業食品研究委員會在1990年為擬南芥菜項目提供了約770萬美元的為期三年的資助,歐共體為擬南芥菜項目設立了一個專門項目歐洲發育與生長生物技術研究(BRIDGE),由英國貝文(M. Bevan)負責協調,共有9個歐共體國家中的33個實驗室加入了此項目, 1991~1992年的總經費為390萬美元。澳大利亞政府為該項目提供了15萬澳元的起始經費,而一些參與此項目的單位,如一些大學和科研機構已提供了100萬澳元的資助費。日本政府亦很重視這個項目,如文部省等國家機構均為此撥專項經費。另外,法國和德國的科學家也越來越多地加入了擬南芥菜的研究,兩國政府也分別為他們的科學家提供了有關經費;蘇聯科學家利用擬南芥菜作為遺傳研究的材料已有較長的歷史,積累了較多的突變體系,現在他們已同意與擬南芥菜基因組項目的兩個材料收集中心合作。
2.擬南芥菜計畫的內容
計畫最終目的不僅是鑑定出此植物中的全部基因和測得基因組全序列,而且要利用擬南芥菜這個實驗模型,從分子水平上揭示有關植物的生理、生化、生長及發育活動的全過程,這將是一項浩大的工程,工程的組織者們也認識到這一點,他們對這項計畫從以下幾個方面作了近期和遠期的規劃。
(1)基因組的分析
基因組分析中包含的內容較多,主要分為三個緊密相連的部分,即作圖、通過突變體研究基因功能和基因克隆及測序。
作圖工作包括遺傳作圖和物理作圖,遺傳作圖中又分以形態性狀為標記的經典遺傳圖譜和基於內切酶片段長度多態性的遺傳圖譜,即RFLP圖譜,此圖譜的作圖示記可為已知的DNA片段,或為用隨機合成的DNA引物通過多聚酶鏈式反應擴增出來的DNA片段(RAPD)。科學家們已做出了兩個擬南芥菜RFLP圖譜,目前其上標有300多個標記;一個含120多個形態特徵的遺傳圖譜和一個含有252個RAPD標記的RFLP圖譜及日本科學家所作的另一個含有140個RFLP標記的圖譜也近完成,現在科學家們正努力將這些遺傳圖譜結合起來以縮短各個標記之間的遺傳距離。
物理圖譜的製作工作分為幾個層次,最詳細的物理圖譜將是基因組的DNA全序,這也是基因組計畫的最終目標之一,要達到這個目標,必須經過很多艱苦的努力。目前能克隆大片段外源DNA的最佳載體為酵母人工染色體(YAC),自從1986年YAC被用來克隆大片段的外源DNA以來[2],其載體發展很快,現已能克隆105~106鹼基的外源DNA片段,而粘粒和噬菌體載體所能克隆的外源DNA片段分別為40×103鹼基和20×103鹼基左右。儘管YAC也有不少不盡人意的地方,如常常出現的外源DNA拼接在一起或重組的現象[3],但它仍是目前為止最有效的克隆大片段外源DNA的載體。因此,YAC便成了連線遺傳圖譜和物理圖譜的一座橋樑。科學家們現已構建了三個擬南芥菜的YAC庫,其中已被鑑定和定位部分的總長度為33000×103 鹼基,占擬南芥菜基因組的1/3,這些YAC庫還被用來連線粘粒克隆,如古德曼(Goodman)等人構建的大約有20000個克隆的粘粒庫,約可歸納為750組連續排列的克隆,若用標記了的YAC與那些排列好的粘粒克隆進行雜交,便有可能進一步將750組克隆連續地排列起來。而對YAC庫中的克隆進行連續排列亦很重要,其方法有好幾種,在此項目中主要用染色體步行和cDNA定位的方法。染色體步行的方法是利用YAC載體的特點,因為YAC載體上有大腸桿菌(E. coli)的複製起始位點和一些細菌體系的選擇標記,將單個YAC克隆的DNA用特定的酶進行水解後,使酶解片段進行自動環化再對大腸桿菌細胞進行轉化並在特定的培養基(如含安苄等)中進行篩選,便有可能得到含有部分載體片段(含有大腸桿菌的複製起始位點及選擇標記)和緊接著載體片段的那段插入的外源DNA,即YAC中外源DNA的末端片段;或根據載體中的DNA序列,設計PCR的引物進行反向PCR,亦可擴增出大量含有部分載體片段和緊接著載體的部分外源DNA片段,用這段DNA與其他的YAC克隆進行雜交,便可望得到與之有重疊的克隆,這樣一段一段不斷地“走”下去,最後便可將一些YAC克隆連續排列起來。cDNA定位的方法即為在對cDNA克隆進行大規模測序的基礎上,用這cDNA克隆與YAC庫進行雜交,從而獲得具有重疊序列的YAC克隆。
(2)突變體的研究
擬南芥菜基因組的目標之一便是利用基因突變的方法研究基因功能,在這方面,研究進展很快。產生基因突變的方法包括化學誘變,放射性照射,T-DNA或轉座子插入等。以前的研究已鑑定了包括與花的形態發生有關的基因,涉及脂肪及胺基酸生物合成功能的基因,以及參與根的形成及生長的基因等200多個新的基因位點。現在,科學家們通過對胚胎及幼苗致死突變體的研究,發現大約有4000多個基因位點與胚胎及幼苗致死有關;對葉綠素缺陷型植物的研究又鑑定了500多個新的基因位點,若按擬南芥菜的基因組中有25000個單拷貝的轉錄單位來算,現在已鑑定了的基因位點約為這些轉錄單位的六分之一。最近的研究還表明,通過研究一些對病原菌或病毒有抗性或易感性的突變體與這些病原菌或病毒的相互關係,可將一些抗性基因定位在RFLP圖上,為分離這些基因打下必要的基礎。有的實驗室已分離到可能含有抗性的基因的YAC片段。
(3)克隆及測序基因
隨著擬南芥菜基因組計畫的開展,基因克隆和測序工作進展得十分迅速,DNA資料庫的統計結果表明,現在克隆並測得其序列的擬南芥菜基因已超過了300個。除了用經典的方法克隆基因外,現在用得較多的是跳躍子標記或T-DNA標記法(T-DNA tagging)[4]。在世界各地保存的約13000個擬南芥菜突變體中,有30%是由於某個基因中被插入 T-DNA而造成的,這些基因中因有 T-DNA插入,所以較易被克隆。在這方面進展較快的是對調控花形態發生髮育基因的研究,如 APETALA3,LEAFY和 PISTLLATA等基因均已從一些無花瓣、花序發育受阻或雌雄蕊位置異常的突變體中克隆出來[5~7],並發現這些基因具有較高的同源性,且與酵母和哺乳動物細胞中的轉錄因子在胺基酸水平上具有一定的同源性。另一類較有趣的是與病原菌侵染後反應有關的基因,如苯丙氨酸解氨酶(PALl),苯基苯乙烯酮合成酶(CHS),谷胱甘肽-S-轉移酶(GSTl),B-l,3-葡聚糖酶(BGLl,BGL2,BGL3)及過氧化物歧化酶(SODl)[8,9]等等,均已被克隆和詳細研究了。
(4)大規模測序
擬南芥菜大規模測序尚未開始,而小規模及中規模計畫正在進行,歐共體所資助的小規模測序主要對象是那些已被研究得較透的基因組中的片段,其目標是每年測25×103鹼基DNA,而中規模的測序計畫目標是按每年1000×103鹼基的速度對一些連續排列的DNA克隆進行測序。
大規模測序cDNA也是擬南芥菜基因組計畫的策略之一,所得的已知序列的cDNA克隆可提供給作圖人員用作標誌,也可為分離測序完整基因提供探針。現在法國科學家已對600多個cDNA克隆進行了測序,發現有約三分之二的序列是新的,他們的目標是將3000~4000個 cDNA克隆部分測序;美國科學工作者則對擬南芥菜根、莖、葉和幼苗的cDNA進行部分測序,由於運用自動機械臂進行樣品的處理和DNA自動測序儀進行測序,他們的進展較快,可在每周內完成200個cDNA克隆的部分測序(每個克隆約測500鹼基對)。
3.技術開發
(l)轉化方法
由於發現了一些高效轉化的擬南芥菜品種,其轉化在不少實驗室已成了常規手段。一些科學家還發現,對去了頂芽的擬南芥菜進行土壤農桿菌接種,至少有五分之一的植株能產生被轉化的後代,這樣就可避免對特定品種的要求和大量組培及篩選的工作;另外,科學家們還在研究用原生質體進行大規模的轉化和植株再生的方法,並探索用植物人工染色體(PAC)來克隆大片段外源 DNA的方法。
(2)克隆基因的新方法
①染色體步行(chromosome walking):由於擬南芥菜的基因組相對較小及分散在基因組中的重複序列相對較少,因此一旦基因被定位在RFLP圖上,即可用其兩邊的RFLP標記作探針進行染色體步行工作,這種工作一般都在以酵母人工染色體為載體的克隆上進行,再輔助於相應的cDNA克隆。現大約有40個參加擬南芥菜項目的實驗室正在進行這項工作,用這種方法克隆的基因有編碼脂肪代謝途徑中一個酶的基因及一個與調節對外源生長激素反應有關的基因。其他正進行的工作包括分離參與植物病原體反應、光激素、光敏色素等的基因以及調控花的發生髮育的基因等。這種做法一般要涉及到基因組中1000×103鹼基以上的片段,花費時間及經費多,工作量大,但仍為分離、克隆和研究特定基因的較有效的方法。這種方法的另一優點便是它將所涉及到的YAC克隆連線排列起來。用這種方法鑑定出的YAC現已占擬南芥菜基因組的三分之一,而YAC中插入的外源DNA片段越大,這種方法越有效。
②插入突變法:用T-DNA標記方法是目前克隆基因的最有效的方法之一,美國杜邦研究中心已將含有T-DNA插入的突變體分發給135個參加此項目的實驗室,此外還有一些實驗正用此方法誘變植株,目前大約有800個突變體己被鑑定,它們包括花發育突變體,胚胎缺陷型突變體,幼苗致死突變體,株型大小及色素突變體以及其他一些形態突變體。除了T-DNA以外,Ac-Ds轉座子也被用於誘發突變體,這方面的工作正進行之中。
4.生物資源中心
生物資源中心的主要任務是為各有關研究單位收集、保存和分配擬南芥菜的種子和DNA樣品。這樣的中心一共有三個,一是美國俄亥俄州立大學的生物資源中心(ABRC),二是英國諾丁漢大學擬南芥菜種源中心(NASC),三是德國科隆的DNA資源中心。這幾個中心,尤其是ABRC和NASC分別負責向美洲及美洲以外的國家提供各種突變體及重組自交體系的種子;這些中心均將有關信息貯入計算機,各地研究人員可通過電子信箱(E-Mail)向中心索訂所需的種子。另外,ABRC中心還存有各種質粒、粘粒及YAC克隆;德國科隆中心也收集有cDNA及核DNA文庫,並向項目參加者提供他們所需的材料。
5.信息系統
為了適應日益增長的研究結果和及時地分析管理好這些數據,英國及法國科學家專門為擬南芥菜項目編寫了資料庫AAtDB,其中包括的內容很多,主要有4個方面。第一為有關作圖方面的信息,其中包括含有14000多個粘粒克隆的YAC物理圖譜、RFLP圖譜及遺傳圖譜,各種作圖的標記如RFLP標記等,及一些作圖所用的主要的數據資料;第二是有關DNA序列方面的數據,GenBank中心所有有關擬南芥菜的序列分析均被收入AAtDB,其中還含有多肽序列及內切酶位點等方面的分析功能;第三是在前文所提到的各中心保存的各種株系和突變體之類的目錄,及它們的形態描述;第四是500多位擬南芥菜研究者的通訊錄和從1964年始至今的有關擬南芥菜的研究文章2700多篇。
目前,AAtDB的作業系統是Unix工作站,X-視窗(X-Windows),適用Mac機的版本正在開發中,此資料庫中心在美國波士頓市的麻省總醫院和哈佛大學。
科學家們還在開發能適用於各種微機或工作站並能通過電子信箱存取的資料庫,同時,他們與其他基因組項目的科學家們合作,建立 cDNA資料庫, 以便使那些已被部分測序的 cDNA序列能及時地收入其中。
信息中心目前正討論在歐洲建立類似的數據信息中心的必要性和可行性。
6.通訊交流系統
除了較早開始的一些郵寄刊物,如德國法蘭克福大學克蘭茲(Kranz)編輯的“擬南芥菜信息服務”,英國弗蘭德斯(Flanders)等人編的“擬南芥菜通訊”外,近兩年來美國GenBankBIOSCI傳播中心設立了有關擬南芥菜信息的電子信箱,這樣,研究人員可以通過電子信箱直接交流有關實驗程式、研究報告、研究結果及各種有關會議的情況等,僅1992年上半年就交流了344條信息。這些信息均被分門別類貯存入計算機系統中。另外,擬南芥菜的研究者們還定期召開擬南芥菜研究大會,不定期地召開研討會,如去年在美國波士頓召開的一個研討會上,科學家們一致認為應儘早地建立起cDNA部分序列的資料庫,以便cDNA大規模測序及分析的有效進行,與會者還就美國國立衛生研究院提出的cDNA專利問題進行了討論,並取得了共識,即不用擬南芥菜的cDNA部分序列去申請專利。
水稻基因圖譜計畫
擬南芥菜是一毫無經濟價值但具較高科研價值的模式植物,而水稻則因其重要的實用價值而被很多科研工作者所青睞。中國是一個水稻大國,開展水稻基因圖譜的研究項目,無論從基礎理論研究還是套用研究上都有很重要的意義,同時,此項目的開展還將有利於國內生物科研隊伍的建設及為吸引留學人員回國創造條件。
在中國於1992年8月正式宣布開展水稻基因圖譜計畫以前,日本已開展了同樣的研究。日本水稻基因組研究項目於1991年10月正式開始,由日本農林水產省和日本賽馬協會資助,農業生物資源研究所的農林水產技術革新學會具體執行,在他們制定的1991~1997年的計畫中,頭四年將重點放在作遺傳圖譜(如RFLP圖譜和經典形態圖譜),構建YAC、粘粒及噬菌體等文庫,及一些組織特異性cDNA文庫。後三年主要是作染色體圖譜,對cDNA進行具體分析,並分離和分析完整的基因。在此同時,對各種分離出的DNA片段進行測序,並將力量集中在第六條染色體上,他們認為一些與抗性有關的基因位於此染色體上。
由於日本在開展水稻基因組研究項目以前就有好的作圖基礎,去年此項目組發表的RFLP圖譜上已有119個標記,根據他們的計畫,在1992年底此圖上將再增加500個標誌,其中的一些DNA克隆亦可提供給其他科研人員作研究。
中國的水稻基因圖譜項目由國家科委資助和領導,下設專家組,組長為中科院上海生化所的洪國藩教授,副組長為北京大學生物系主任陳章良教授,具體參加的科研單位共有六個。其中心實驗室在中科院上海生化所,其他五個衛星實驗室分別是北京大學生命科學院,復旦大學生命科學學院,中科院遺傳所,華中農業大學和中國水稻研究所。
中國水稻基因圖譜研究的第一個五年計畫的重點是遺傳作圖,構建一些組織、器官的cDNA文庫,並進行特異性表達基因的研究;同時引進一些技術及設備,包括YAC文庫的構建技術及一些計算機資料庫及分析軟體。目前各項工作均在進行中。
各種生物基因組研究項目的開展將帶動生物科學各個學科的不斷深入,也將促進生物技術的快速發展。最近幾年的人類基因組、酵母基因組及擬南芥菜基因組等研究項目的成果已充分說明了這一點。而預計在本世紀末完成的酵母和擬南芥菜基因組全序列的測定及分析結果也將會進一步完善現有的生物學理論,並為完成較複雜生物如人類、水稻等基因組的研究奠定不可缺少的基礎。
[l] Magnien E,Bevan M and Planque K.TIB,1992,10:12-15
[2] Burke E T,Carle G R,Olson M V.Science,1987,236:806-812
[3] Anderson C.Science,1993,259:1684-1687
[4] Walbot V.Plant Physiol Plant Mol Biol,1992,43:49-82
[5]Bowman J L,Drews G N,Meyerowitz E M.Plant Cell,1991,3:749-758
[6]Jack T,Brockman L L,Meyerowitz E M.Cell,1992,68:683-697
[7] Weigel D,Alvarez J,Smith D R,et al. Cell, 1992,69:843-859
[8] Hindges R and Slusarenko A.Plant Mol Biol,1992,18:123-125
[9] Whalen M C,Innes R W, Bent A F,et al. Plant Cell, 1991,3:49-59