簡介,種類,特點,區別與聯繫,起源,作用,密碼錶,胺基酸特性,語法及舉例,破解歷史,區別聯繫,套用,提高基因的異源表達,翻譯起始效應,影響蛋白質的結構與功能,基因定位功能,預測進化規律,
簡介
密碼子(condon):mRNA(或DNA)上的三聯體核苷酸殘基序列,該序列編碼著一個指定的胺基酸 ,tRNA 的反密碼子與mRNA的密碼子互補。
起始密碼子(iniation codon):指定蛋白質合成起始位點的密碼子。最常見的起始密碼子是蛋氨酸密碼:AUG
終止密碼子(termination codon):任何tRNA分子都不能正常識別的,但可被特殊的蛋白結合併引起新合成的肽鏈從翻譯機器上釋放的密碼子。存在三個終止密碼子:UAG ,UAA和UGA。
種類
構成RNA的鹼基有四種,每三個
鹼基的開始兩個決定一個
胺基酸。從理論上分析鹼基的組合有4的3次方=64種,64種鹼基的組合即64種密碼子。怎樣決定20種胺基酸呢?仔細分析20種胺基酸的密碼子表,就可以發現,同一種胺基酸可以由幾個不同的密碼子來決定,
起始密碼子為AUG(
甲硫氨酸) , 另外還有UAA、UAG、UGA三個密碼子不能決定任何胺基酸,是
蛋白質合成的
終止密碼子。1994年版
曾邦哲著《
結構論》中對密碼子和胺基酸的
組合數學計算公式為:C1/4+2C2/4+C3/4=20胺基酸,C1/4+6(C2/4+C3/4)=64密碼子。(另有算法4*4*4=64,一個密碼子裡面三個鹼基每個位置有4種可能)
特點
①. 遺傳密碼子是
三聯體密碼:一個密碼子由
信使核糖核酸(mRNA)上相鄰的三個
鹼基組成。② 密碼子具有通用性:不同的生物密碼子基本相同,即共用一套密碼子。
③ 遺傳密碼子無逗號:兩個密碼子間沒有標點符號,密碼子與密碼子之間沒有任何不編碼的核苷酸,讀碼必須按照一定的
讀碼框架,從正確的起點開始,一個不漏地一直讀到
終止信號。
④ 遺傳密碼子不重疊,在
多核苷酸鏈上任何兩個相鄰的密碼子不共用任何核苷酸。
⑤ 密碼子具有
簡併性:除了甲硫氨酸和色氨酸外,每一個胺基酸都至少有兩個密碼子。這樣可以在一定程度內,使胺基酸序列不會因為某一個鹼基被意外替換而導致胺基酸錯誤。
⑥ 密碼子閱讀與翻譯具有一定的方向性:從5'端到3'端。
⑦有
起始密碼子和
終止密碼子,起始密碼子有兩種,一種是甲硫氨酸(AUG),一種是纈氨酸(GUG),而終止密碼子(有3個,分別是UAA、UAG、UGA)沒有相應的轉運核糖核酸(tRNA)存在,只供
釋放因子識別來實現翻譯的終止。
區別與聯繫
遺傳信息是指
DNA分子中
基因上的
脫氧核苷(鹼基)排列順序,密碼子是指信使RNA上決定一個胺基酸的三個相鄰鹼基的排列順序,反密碼子是指轉運RNA上的一端的三個鹼基排列順序。其聯繫是:DNA(基因)的遺傳信息通過轉錄傳遞到信使RNA上,轉運RNA一端攜帶胺基酸,另一端反密碼子與信使RNA上的密碼子(鹼基)配對。
起源
除了少數的不同之外,地球上已知生物的
遺傳密碼均非常接近;因此根據
演化論,遺傳密碼應在生命歷史中很早期就出現。現有的證據表明遺傳密碼的設定並非是隨機的結果,對此有以下的可能解釋:
最近一項研究顯示,一些
胺基酸與它們相對應的
密碼子有選擇性的化學結合力(立體化學假說,stereochemical hypothesis),這顯示現在複雜的蛋白質製造過程可能並非一早存在,最初的蛋白質可能是直接在核酸上形成。但也有學者認為,胺基酸和相應編碼的忠實性反映了胺基酸
生物合成路徑的相似性,並非物理化學性質的相似性(
共進化假說,co-evolution hypothesis)。
謝平指出,
遺傳密碼子是生化系統的一部分,因此,必須與生化系統的演化相關聯,而生化系統的核心是
ATP,只有它才能建立起
核酸和
蛋白質之間的聯繫(
ATP中心假說,ATP-centric hypothesis):ATP(a)是光能轉化成化學能的終端,(b)導演了一系列的生化循環(如
卡爾文循環、
糖酵解和
三羧酸循環等)及元素重組,(c)它通過自身的轉化與縮合將錯綜複雜的生命過程信息化——篩選出用4種鹼基編碼20多個胺基酸的
三聯體密碼子系統、精巧地構建了一套
遺傳信息的保存、
複製、
轉錄和
翻譯以及
多肽鏈的生產體系,(d)演繹出蛋白質與核酸互為因果的
反饋體系,在個體生存的方向性篩選中,構築了對細胞內成百上千種同步發生的生化反應進行秩序化管控(
自組織)的複雜體系與規則,並最終建立起個性生命的同質化傳遞機制——
遺傳。
原始的
遺傳密碼可能比今天簡單得多,隨著
生命演化製造出新的胺基酸再被利用而令遺傳密碼變得複雜。雖然不少證據證明這觀點,但詳細的演化過程仍在探索之中,。 經過
自然選擇,現時的遺傳密碼減低了
突變造成的不良影響。即,遺傳密碼是由選擇(selection)、歷史(history)和化學(chemistry)三個因素在不同階段起作用的(綜合進化假說)。
作用
密碼錶
首先,密碼錶不是生物的事實。而是基於已有的20個必需胺基酸首字母縮寫,添加缺如的6個字母后得到的。
依次根據胺基酸三字母縮寫,中文譯名拼音首字母尋找相關,再以其中密碼子簡併性(即重複性)最強的胺基酸為首選進行替代,具體變換為:
GCA,GCG: A→B
AGA,AGG: R→J
CCA,CCG: P→O
UUA,UUG: L→U
GUA,GUG: V→X
CAC : H→Z
需要強調,這一編碼方案忽略了既有的B、Z的使用,以及忽略了終止密碼子間真實的強弱性。
正向翻譯備選方案
A: GCU, GCC.
B: GCA, GCG.
C: UGU, UGC.
D: GAU, GAC.
E: GAA, GAG.
F: UUU, UUC.
G: GGU, GGC, GGA, GGG.
H: CAU.
I: AUU, AUC, AUA.
J: AGA, AGG.
K: AAA, AAG.
L: CUU, CUC, CUA, CUG.
M: AUG.
N: AAU, AAC.
O: CCA, CCG.
P: CCU, CCC.
Q: CAA, CAG.
R: CGU, CGC, CGA, CGG.
S: UCU, UCC, UCA, UCG, AGU, AGC.
T: ACU, ACC, ACA, ACG.
U: UUA, UUG.
V: GUU, GUC.
W: UGG.
X: GUA, GUG.
Y: UAU, UAC.
Z: CAC.
起始符:AUG【與M的編碼相同,但之後需加空格□(UAA)】
空格□:UAA
斷句符:UAG
終止符:UGA反向翻譯:見圖“修改後的密碼錶”
胺基酸特性
第 一 位 鹼 基 U
UUU (Phe/F)苯丙氨酸
UUC (Phe/F)苯丙氨酸
UUA (Leu/L)亮氨酸
UUG (Leu/L)亮氨酸
UCU (Ser/S)絲氨酸
UCC (Ser/S)絲氨酸
UCA (Ser/S)絲氨酸
UCG (Ser/S)絲氨酸
UAU (Tyr/Y)酪氨酸
UAC (Tyr/Y)酪氨酸
UAA (終止)
UAG (終止)
UGU (Cys/C)半胱氨酸
UGC (Cys/C)半胱氨酸
UGA (終止)
UGG (Trp/W)色氨酸
第 一 位 鹼 基 C
CUU (Leu/L)亮氨酸
CUC (Leu/L)亮氨酸
CUA (Leu/L)亮氨酸
CUG (Leu/L)亮氨酸
CCU (Pro/P)脯氨酸
CCC (Pro/P)脯氨酸
CCA (Pro/P)脯氨酸
CCG (Pro/P)脯氨酸
CAU (His/H)組氨酸
CAC (His/H)組氨酸
CAA (Gln/Q)谷氨醯胺
CAG (Gln/Q)谷氨醯胺
CGU (Arg/R)精氨酸
CGC (Arg/R)精氨酸
CGA (Arg/R)精氨酸
CGG (Arg/R)精氨酸
第 一 位 鹼 基 A
AUU (Ile/I)異亮氨酸
AUC (Ile/I)異亮氨酸
AUA (Ile/I)異亮氨酸
AUG (Met/M)甲硫氨酸(起始)
ACU (Thr/T)蘇氨酸
ACC (Thr/T)蘇氨酸
ACA (Thr/T)蘇氨酸
ACG (Thr/T)蘇氨酸
AAU (Asn/N)天冬醯胺
AAC (Asn/N)天冬醯胺
AAA (Lys/K)賴氨酸
AAG (Lys/K)賴氨酸
AGU (Ser/S)絲氨酸
AGC (Ser/S)絲氨酸
AGA (Arg/R)精氨酸
AGG (Arg/R)精氨酸
第 一 位 鹼 基 G
GUU (Val/V)纈氨酸
GUC (Val/V)纈氨酸
GUA (Val/V)纈氨酸
GCU (Ala/A)丙氨酸
GCC (Ala/A)丙氨酸
GAU (Asp/D)天冬氨酸
GAC (Asp/D)天冬氨酸
GAA (Glu/E)谷氨酸
GGU (Gly/G)甘氨酸
GGC (Gly/G)甘氨酸
GCA (Ala/ A)丙氨酸
GCG (Ala/A)丙氨酸
GUG (Val/V)纈氨酸
GAG (Glu/E)谷氨酸
GGG (Gly/G)甘氨酸G)
語法及舉例
語法:
b.空格 (□) 用 UAA;
c.逗號或其它文章內斷續標點用 UAG;
d.編碼結束(最後一個句號)用 UGA表示;
e. 默認為表達英語,如果需要表達其它語種,可以在起始信號(5'端)前延長6個鹼基,編碼語言使用語言的國家雙字母縮寫,如拼音加注CN,日語假名羅馬體加注JP等。
舉例:
通用語言:I love U.
中轉:(Start)□I□love□U.
最終的核酸語言:AUG UAA AUU UAA CUG CCA GUC GAA UAA UUA UGA
可以和
連鶴或串珠等實體結構結合來進行空間變換,加強教學效果。但需要使使用者謹記這套
密碼系統是修改過的。
破解歷史
尼倫伯格(M.W.Nirenberg,1927—2010)和
馬太(H.Matthaei)破譯出了第一個遺傳密碼。
尼倫伯格和馬太採用了蛋白質的體外合成技術。他們在每個試管中分別加入一種胺基酸,再加入除去了DNA和mRNA的細胞提取液,以及人工合成的RNA多聚
尿嘧啶核苷酸,結果加入了苯丙氨酸的試管中出現了多
聚苯丙氨酸的
肽鏈。實驗結果說明,多聚尿嘧啶核苷酸導致了多聚
苯丙氨酸的合成,而多聚尿嘧啶核苷酸的鹼基序列是由許多個尿嘧啶組成的(UUUUUUUU......),可見尿嘧啶的鹼基序列編碼由苯丙氨酸組成的肽鏈。結合
克里克得出的3個鹼基決定1個胺基酸的實驗結論,與苯丙氨酸對應的密碼子應該是UUU。在此後的六七年裡,科學家沿著蛋白質體外合成的思路,不斷地改進實驗方法,破譯出了全部的密碼子,並編輯出了密碼子表。
區別聯繫
遺傳信息是指DNA分子中
基因上的
脫氧核苷(鹼基)排列順序,密碼子是指信使RNA上決定一個胺基酸的三個相鄰鹼基的排列順序,反密碼子是指轉運RNA上的一端的三個鹼基排列順序。其聯繫是:DNA(基因)的遺傳信息通過轉錄傳遞到信使RNA上,轉運RNA一端攜帶胺基酸,另一端
反密碼子與信使RNA上的密碼子(鹼基)配對。
套用
提高基因的異源表達
可通過分析密碼子使用模式,預測目的基因的最佳宿主;或者套用基因工程手段,為目的基因表達提供最優的密碼子使用模式。3種不同的方式,目的都是利用密碼子偏性來提高異源基因的表達。
翻譯起始效應
mRNA濃度是翻譯起始速率的主要影響因素之一,密碼子直接影響轉錄效率,決定mRNA濃度。如單子葉植物在“翻譯起始區”的密碼子偏性大於“翻譯終止區”,暗示“翻譯起始區”的密碼子使用對提高蛋白翻譯的效率和精確性更為重要,因此,通過修飾編碼區5′端的DNA序列,來提高蛋白質的表達水平將有望成為可能。
影響蛋白質的結構與功能
基因的密碼子偏性與所編碼蛋白質結構域的連線區和二級結構單元的連線區有關、翻譯速率在連線區會降低。馬建民等通過聚類分析的方法研究發現,哺乳動物MHC基因的密碼子偏性與所編碼蛋白質的三級結構密切相關,並可通過影響mRNA不同區域的翻譯速度,來改變編碼蛋白質的空間構象。其研究所選取的蛋白結構單位是蛋白指紋,它在很大程度上也是一種蛋白功能單位,表明密碼子偏性與蛋白的功能也存在密切相關。改變密碼子使用模式可目的性改變特定蛋白質的結構與功能。
基因定位功能
密碼子的使用模式在細胞核和細胞質遺傳物質之間也存在差異,如核基因中的起始密碼子只有ATG,而線粒體基因中的起始密碼子為ATN;核基因中的終止密碼子TGA線上粒體基因中用來編碼色氨酸等。因此,可以通過比較密碼子的使用模式,來進行真核生物核糖體在細胞內以及未知蛋白基因在基因組的定位。
預測進化規律
類似的密碼子使用模式,預示著物種相近的親緣關係或生存環境。目前已有研究通過比較密碼子偏性的差異程度,來分析物種間的親緣關係和進化歷程。線粒體基因組具有母系遺傳、分子結構簡單、多態性豐富等優點,是一種重要的分子標記,研究其密碼子使用偏好性,可以很好地用於確定動物類群的遺傳分化和系統發生關係。