ESTs

介紹

ESTs的產生：從特定的狀態的組織或細胞中分離mRNA，將mRNA逆轉錄成cDNA亞克隆到載體中，利用載體上的引物對插入片段測序測序出來的片段結果即稱為ESTs(expressed sequence tags)。

EST 的產生過程注定其具有以下特性：

1、由於是單次測序結果，序列的精確度較低，存在較多錯誤。(大約2% error，HGP 錯誤率標準是<0.01%)；

2、重複結果多，不同EST‘s t往往來自同一個基因

3、大部分EST序列來IMAGE consortium的序列在Washington university的基因組測序中心測序，占GENEBANK中EST庫的大半，較為可靠。大部分dbEST都有IMAGE ID，描述其組織或細胞來源，測序情況。由於這些特性，導致目前EST面臨的最大問題是序列質量不高，存在：

1缺失、替代、插入等變異（與mRNA相比）

2、測序中的錯誤引發大約1.5%的利用oligoT產生的EST無法與已知的mRNA的3端比對上；

3、倒置（5端和3端弄反，插入克隆載體時出錯）；

4 嵌合EST（5端和3端來自不同mRNA）因此，在對EST做Blast時最好用BlastX和Tblastx了解了上述特點及問題後，有利於我們更好地套用ESTs

表達序列標籤（expressed sequence tags,ESTs）是指從不同組織來源的cDNA序列。這一概念首次由Adams等於1991年提出。近年來由此形成的技術路線被廣泛套用於基因識別、繪製基因表達圖譜、尋找新基因等研究領域，並且取得了顯著成效。在通過mRNA差異顯示、代表性差異分析等方法獲得未知基因的cDNA部分序列後，研究者都迫切希望克隆到其全長cDNA序列，以便對該基因的功能進行研究。克隆全長cDNA序列的傳統途徑是採用噬斑原位雜交的方法篩選cDNA文庫，或採用PCR的方法，這些方法由於工作量大、耗時、耗材等缺點已滿足不了人類基因組時代迅猛發展的要求。而隨著人類基因組計畫的開展，在基因結構、定位、表達和功能研究等方面都積累了大量的數據，如何充分利用這些已有的數據資源，加速人類基因克隆研究，同時避免重複工作，節省開支，已成為一個急迫而富有挑戰性的課題擺在我們面前，採用生物信息學方法延伸表達序列標籤（ESTs）序列，獲得基因部分乃至全長cDNAycg，將為基因克隆和表達分析提供空前的動力，並為生物信息學功能的充分發揮提供廣闊的空間。文本將就EST技術的套用並就其在基因全長cDNA克隆上的套用作一較為詳細的介紹。

1、ESTs與基因識別

EST技術最常見的用途是基因識別，傳統的全基因組測序並不是發現基因最有效率的方法，這一方法顯得即昂貴又費時。因為基因組中只有2%的序列編碼蛋白質，因此一部分科學家支持首先對基因的轉錄產物進行大規模測序，即從真正編碼蛋白質的mRNA出發，構建各種cDNA文庫，並對庫中的克隆進行大規模測序。Adams等提出的表達序列標籤的概念標誌著大規模cDNA測序時代的到來。雖然ESTs序列數據對不精確，精確度最高為97%，但實踐證明EST技術可大大加速新基因的發現與研究。Medzhitov等通過果蠅黑胃TOLL蛋白進行dbEST資料庫檢索，該蛋白已證實在成熟果蠅抗真菌反應中發揮重要作用，通過同源分析的方法，找到相應的人類同源EST（登錄號為H48602），這為接下來研究人類TOLL同源蛋白的功能提供了很好的條件。hMSH5基因是從釀酒酵母菌MSH5存在30%的一致性，它與hMSH4特異性相互作用，在減數分裂和精子發生過程中發揮一定的作用。由此可見，套用EST技術，可以跳過生物分類學的界限，從生物模型的已識別基因迅速克隆出人和小鼠基因組相應的更複雜的未知基因。生物間在核苷酸水平上的進化差異阻礙了傳統意義上的雜交或以PCR為基礎的基因克隆策略，即使是親緣關係很接近的生物也不例外，如C.elegans和C.briggsae，它們僅在2～5千萬年前分化形成。而通過計算機進行dbEST進行資料庫篩選，其配製是電子雜交實驗，提供了一條更為廣泛的基因識別路線，這一路線允許基因組間存在差異，這使得基因識別與新基因克隆策略發生革命性變化，同時它也提供了一個足夠大小和複雜的基因資料庫，目前，ESTs數量正以平均每月10萬條的速度遞增。

ESTs

基本介紹

介紹

結論

相關詞條

熱門詞條