特徵
大部分假基因在染色體上都位於正常
基因的附近,但也有位置在不同的
染色體上的。假基因和正常基因的結構上的差異包括在不同部位上的程度不等的缺失或插入、在
內含子和外顯子鄰接區中的順序變化、在5'端啟動區域的缺陷等。這些變化往往使假基因不能轉錄並形成正常的(mRNA)從而不能表達。
產生方式
複製
即複製後基因發生序列變化而失去功能,這樣產生的假基因帶有內含子,稱為non-processed或duplicatedpseudogenes
反座
即mRNA轉錄本經過反轉錄為cDNA,再插入基因組,由於插入位點不合適或序列發生變化而導致失去功能。這種類型的假基因不含內含子,被稱為processedpseudogenes,或retropseudogene。
代表
加工假基因
有一類假基因除了一般的特徵之外,還有一些其他的特徵暗示著它們的形成與
mRNA有關:
①在假基因中完全缺少在相應的正常基因中存在的內含子順序;
②在假基因的3'末端有一段連貫的脫氧腺嘌呤核苷酸;
③有些假基因與相應的正常基因在順序組成上的相似性只限於相應的mRNA的3'末端之前的部分序列
所有這些特徵都酷似具有內含子的正常基因的轉錄產物經加工後形成的mRNA。據此推測這種假基因的DNA順序可能不是來自正常基因的直接複製品,而是以mRNA為中介的正常基因的間接複製品,所以又稱為加工基因。例如編碼人的免疫球蛋白的輕鏈、β微管蛋白、小鼠的
珠蛋白以及大鼠的微管蛋白基因的假基因都是加工基因。加工基因可能是在真核生物細胞中的mRNA先經
反向轉錄形成DNA,再整合到染色體上而形成的。已知致癌的
RNA病毒具備這種機制,然而假基因形成的真正機制仍然是一個正在研究中的課題。
人類假基因
迄今為止,明確鑑定的人類假基因多為已加工假基因,有8000個之多。在Swiss-Prot/TrEMBL收錄的編碼蛋白質的將近25500個基因序列中,約10%在基因組中有一個或多個近全長已加工假基因。其餘的功能基因都沒有已加工假基因。
核糖體蛋白基因具有最多數量的已加工假基因,約有1700個(占已加工假基因數的22%),少數基因,如cyclophilinA、
肌動蛋白(actin)、
角蛋白(keratin)、GAPDH、
細胞色素C(cytochromec)和nucleophosmin等則有很多份已加工假基因。總體上講,假基因在人類染色體上的分布與染色體長度成比例,但已加工假基因在GC含量為41%~46%的染色體區域密度最高。已加工假基因的拷貝數和功能基因在生殖器官中的表達高度一致,說明許多假基因發生在胚胎階段,另外也和基因中GC含量和基因大小密切相關。假基因的準確鑑定對基因組進化、分子醫學研究和醫學套用具有重要意義。
人α-珠蛋白
基因座的一個假基因ψαl,同三個有功能的α-珠蛋白基因在DNA序列上是相似的,只是假基因中含很多突變,如
起始密碼子ATG變成GTG;5’端的兩個
內含子也有突變,可能是破壞了RNA剪接;在編碼區內也有許多
點突變和缺失。DNA序列比較表明,ψαl,假基因同有功能的α2基因的序列相似性達73%。ψαl假基因被認為是由α-珠蛋白基因複製產生的。開始時,這個複製生成的基因是有功能的,後來在進化的某個時期產生了一個失活突變。由於該基因是複製生成的,所以儘管失去了功能,但是不致影響到生物體的存活。隨後在假基因中又積累了更多的突變,從而形成了現今的假基因的序列。人的δ-珠蛋白基因編碼兩種β類珠蛋白中的一種,但其mRNA水平很低,編碼生成的蛋白質也不是必不可少的,因為成年人還同時表達產生另一種β類珠蛋白,所以δ-珠蛋白基因被認為是介於功能基因同無功能假基因之間的一種中間物。
人類α珠蛋白基因簇和人類β珠蛋白基因簇返座假基因
編碼潛能
到目前為止,少數無致命突變而可能存在編碼能力的返座假基因已作功能研究,如人metallothioneinⅡ假基因,鼠L32
核糖體蛋白的一個假基因rpL32-4A等等。人metallothioneinⅡ假基因5’端上游缺乏
RNA聚合酶Ⅱ轉錄所需的各種元件,且在Hela細胞及鼠
L細胞中未發現轉錄活性。鼠L32核糖體蛋白的一個假基因rpL32-4A的5’端上游-30bp位置上有“ATA” 盒(RNA聚合酶Ⅱ轉錄所需元件之一),雖然其轉錄活性未經直接檢測,但對其序列的
甲基化程度研究顯示,它可能不被
轉錄。所以,返座假基因可能在其插入基因組時就失活了,即它們不能被RNA聚合酶Ⅱ轉錄而形成有活性的mRNA。考慮到返座假基因是隨機插入到哺乳動物基因組中,能準確插入到一個RNA聚合酶Ⅱ啟動子下游的可能性是很小的。在一些極罕見的例子中,即從mRNA上游啟始的異常
轉錄本(往往由RNA聚合酶Ⅲ轉錄)可能帶有正常的
啟動子序列,從而能夠產生一個有功能活性的返座基因(retrogene),如鼠
前胰島素原Ⅰ基因。
機理
對於許多已知的返座假基因,如肌管蛋白假基因、肌動蛋白假基因、葡萄糖-3-磷酸脫氫酶等等,它們的功能基因能夠在非分化細胞(如生殖細胞和非分化的腫瘤細胞)中表達。這些返座假基因的長度和多聚腺嘌呤尾提示著它由RNA聚合酶Ⅱ轉錄而來。上面提到的異常
轉錄本(如
人免疫球蛋白ε及λΨ1假基因和鼠Ψα3-
珠蛋白假基因被認為可能是由RNA聚合酶Ⅲ轉錄而來。Mathias等認為有自主返座能力的長散布
重複序列L1產生的蛋白質能夠作用於Alu轉座子及細胞的mRNA(如返座假基因)並促進其返座。Luan等在對昆蟲非長
末端重複元件(non-LTRelement)R2BM的研究基礎上,提出了目標引導反轉錄(target-primedreversetranscription,TPRT)的返座機制。儘管一些資料已證實這種機制,但所提出的返座途徑的具體步驟仍存在未解決的問題。
基因作用
在進化年代上,所有的返座假基因都在哺乳動物輻射(mammalianradiation)之後出現,即返座假基因只存在於哺乳動物中。人DHFRΨ1假基因在人群中甚至還有一定的
多態性。由於返座假基因對於物種本身沒有提供什麼明顯的選擇優勢,因此曾被認為是一種“分子寄生物”(molecularparasite)。現在普遍認為,產生大量返座假基因的非病毒返座作用(retroposition)作為一種進化的主要動力,通過促進序列連續性的複製、散布和重組,保持著真核生物基因組的流動性(fluidity)。由於基因組的流動性保證了胞核和
胞質這兩個不同遺傳區域的
遺傳信息的持續交換,通過遺傳信息複製性散布產生大量新的序列組合的返座作用就能從很多不同的方面來塑造和重塑真核生物基因組。假基因與內含子、衛星序列、
轉位因子等冗餘DNA一樣,是不受進化的
負選擇作用的。從這個意義上說,假基因是功能基因的“棄兒”。但正是這些看似無用的
遺傳變異為物種進化的
正選擇、負選擇以及中性漂變提供了豐富的原材料,從而成為物種進化不可或缺的有用“工具”。
作用
Hirotsune博士指出:“這些發現將有助於未來人類疾病的治療。當老鼠的假基因
假基因功能被阻斷,疾病就產生了,因此,理論上來說,假基因的功能異常也可能是導致人類疾病產生的因子。”其實這項發現是隨機發生的,因為當時研究人員是為了另一項完全不同的實驗製作轉殖鼠,他們將DNA注入受精卵,使得DNA隨機嵌入老鼠的基因組。Wynshaw-Boris博士表示:“我們期望轉殖鼠會因為注入基因的影響而表現出直接的反應,如此一來,我們便可以從中學習到這項基因的功能。然而,由於注入的基因是隨機嵌入老鼠原有基因組中的,因此會偶然中斷老鼠其他基因的功能,老鼠便出現預想不到的特徵;我們就發現一組老鼠出現不尋常且嚴重的
病徵。”那組老鼠幾乎都死亡,存活下來者出現嚴重腎臟及骨骼疾病,並且會將這些缺陷傳給下一代,因此研究人員決定進一步研究這項意想不到的發現。Wynshaw-Boris博士研究發現基因嵌入位點有三個基因,進一步的研究排除了兩項基因,因而認定這第三項基因---假基因makorin1-p1為老鼠產生異常的主要禍首。Hirotsune表示:“由於假基因是沒有能力產生蛋白的,因此我們很想知道這假基因是如何使老鼠產生疾病的?”
研究人員還發現,假基因makorin1-p1為一碎片基因,它類似於一完整的蛋白基因稱為makorin1,此makorin1位於另一染色體上。 正常老鼠腎臟中有大量表現的makorin1蛋白,而當假基因makorin1-p1失去功能時,makorin1蛋白的表現也相對減弱且呈現異常,進一步的研究結果發現,makorin1-p1在調節makorin1的穩定度上扮演非常重要的角色。