HHblits

HHblits：（ Homology detection by iterative HMM-HMM comparison）同源檢測疊代的HMM-HMM的比較

該研究由慕尼黑大學基因中心的計算機生物學家Johannes Söding帶領,已經開發出一種新的序列搜尋方法來鑑別資料庫中相似序列的蛋白,該方法可以更加快速,能夠比以前的方法快出兩倍發現許多與進化相關的蛋白.來自已鑑定蛋白的功能和結構性能的結論,可以為要分析的蛋白性能做好鋪墊.“我們的方法將會擴發序列分析的範圍和能力,這將會促進許多蛋白質結構和功能的實驗說明”, Söding說.

蛋白質涉及生命的幾乎所有生物化學過程.蛋白質執行的功能大部分決定於20種胺基酸的構成組塊和三維空間結構.從蛋白序列的相似性,生物信息學的方法可以預測它們的進化關係,意味著相似的結構和功能.因此,要研究的蛋白質受到標準的序列搜尋,它們的序列與公共資料庫中上百萬個帶有注釋的結構和功能序列進行比對.蛋白質的性質可以從有類似序列蛋白的性質進行推斷,包括它的結構和功能.

公開的資料庫儲存了已知的蛋白質序列,與它們其他的生物學功能信息一起,為這種對比提供了便利.“這種序列分析是生物信息學領域的一種基本工具,”Söding解釋說.

序列搜尋程式評估序列相似性通過計算機雙列隊：兩個胺基酸序列被安排在一個同列成對的最相同或相似的胺基酸之上.“也許比搜尋成對序列相似性更重要的的是所謂多種序列列隊的裝配；在這種情況下,在許多相關蛋白排列的矩陣中尋找相似序列,每個序列填滿一行,相似的胺基酸最終在同一欄”Söding說.

在過去的15年中,PSI-BLAST程式是最流行的蛋白質序列比對工具,它結合了速度和高的敏感性和精度.現在,Söding的小組已經設計好了一個方法——HHblits,在各方面表現明顯的超過了PSI-BLAST.這個改進在很大程度上是由於兩大因素.一個是研究人員轉換興趣序列和資料庫序列在隱藏馬爾科夫模型（HMMs）中搜尋.HMMs是包含序列構造決定的突變可能性的統計模型,因此這個步驟增加了隨後相似搜尋的敏感性和精確性.此外,研究組開發了一個過濾程式,允許他們減少大量需要被搜尋的數據而絲毫沒有降低敏感度.

每一列標記了219個“字母”中一個,這樣類似胺基酸組成的序列由相同的字母代表.“通過翻譯多重序列成由這219個字母組成的序列,我們可以替代耗時的HMMs比較單一序列的兩兩比較,”Söding說.這樣就減少了2500倍的搜尋時間.Söding強調,“HHblits允許預測蛋白質的功能和結構比先前更加頻繁和精確.”

他的團隊正在進行進一步的方法改良,例如通過合併蛋白質結構的三維信息.

HHblits

基本介紹

相關詞條

熱門詞條