後基因組學

HGP即將完成,我們即將進入“後基因組學”(post-genomics)時代。基因組學研究重心已開始從揭示生命的所有遺傳信息轉移到在分子整體水平對功能的研究上,這種轉向的一個標誌是產生了功能基因組學(functional genomics)這一新學科。

基本介紹

  • 中文名:後基因組學
  • 外文名:post-genomics
  • 別稱蛋白質工程
  • 結構預測:二級結構預測和空間結構預測
釋義,與生物信息學相關的研究,

釋義

人類基因組圖揭示了人類遺傳的機密,而對生命活動起調節作用的是蛋白質。與基因組相比,蛋白質的結構和功能更精彩,人的生命活動和健康的維護,最終要靠蛋白質的解析得到解決,這就是即將興起的後基因組學,或稱蛋白質工程
基因組學實際上是為功能基因組學做準備,一旦功能基因組學進入實質性的發展階段,人類將可以從中獲得更大的利益。功能基因組的任務是進行基因組功能注釋(Genome annotation),了解基因的功能,認識基因與疾病的關係,掌握基因的產物及其在生命活動中的作用。在使用全局方法進行研究時,研究人員同時檢測大量基因的表達水平,從而在整體水平上獲得關於基因功能及基因之間相互作用的信息。如果說生物信息學在HGP中的著重點是基因組序列的話,那么在功能基因組中,生物信息學的著重點則是序列的生物學意義,基因組編碼序列的轉錄、翻譯的過程和結果,著重分析基因表達調控信息,分析基因及其產物的功能。在功能基因組時代,套用生物信息學方法,高通量地注釋基因組所有編碼產物的生物學功能是一個重要的特徵。功能基因組學的研究主要包括以下幾個方面的內容,並且這幾方面都與生物信息學密切相關。(1)進一步識別基因,識別基因轉錄調控信息,分析遺傳語言。(2)注釋所有基因產物的功能,這是基因組功能注釋的主要層次。序列同源性分析、生物信息關聯分析、生物數據挖掘是進行功能注釋的主要生物信息學手段。(3)研究基因的表達調控機制,研究基因在生物體代謝途徑中的地位,分析基因、基因產物之間的相互作用關係,繪製基因調控網路圖;(4)比較基因組學研究,在基因組水平對各個生物進行對照比較,可以揭示生命的起源和進化、發現蛋白質功能。

與生物信息學相關的研究

1、基因表達數據的分析與處理
基因表達數據分析是生物信息學研究的熱點和重點。對基因表達數據的處理主要是進行聚類分析,將表達規律相似的基因聚為一類,在此基礎上尋找相關基因,分析基因的功能。所用方法有相關分析方法,模式識別技術中的層次式聚類方法,人工智慧中的自組織映射神經網路。此外還有主元分析方法,利用主元分析可以在多維數據集合中確定關鍵變數的特點,分析在不同條件下基因回響的規律和特徵。進一步的分析還可以探索基因的轉錄調節網路,發現基因在環境或藥物作用下表達模式的變化,闡明一些基因對另一些基因的調節作用。利用聚類分析的結果可以研究基因的啟動子,分析表達模式相同的一類基因的啟動子組成特性,通過多重序列比對操作,在各個基因序列的上游區域尋找共同的啟動子。雖然聚類方法是基因表達數據分析的基礎,但是這類方法只能找出基因之間簡單的、線性的關係,需要發展新的分析方法以發現基因之間複雜的、非線性的關係。
最近國際上在基因調控網路分析方面出現了許多有意義的工作,建立起一些基因調控網路的數學模型,如布爾網路模型、線性關係網路模型、微分方程模型、互信息相關網路模型等,在此基礎研究基因調控網路的動力學性質。
2、蛋白質結構預測
蛋白質是組成生物體的基本物質,是生命活動的主要承擔者,一切生命活動無不與蛋白質有關。蛋白質的生物功能由蛋白質的結構所決定,因此在研究蛋白質時需要了解蛋白質的空間結構。蛋白質序列資料庫中大約有24萬個蛋白質的序列數據,但在結構資料庫PDB中,僅有7500個蛋白質的空間結構數據。雖然蛋白質結構測定方法有所改進,但仍不能滿足實際的需要。核酸酶變性及重摺疊實驗,為從蛋白質的胺基酸序列預測蛋白質的三維空間結構提供了實驗基礎。直接從蛋白質序列預測蛋白質結構對研究蛋白質結構與功能關係十分有用,這也將促進蛋白質工程和蛋白質設計的發展。從原理上講,蛋白質序列隱含了蛋白質摺疊後的空間結構,理論上可以從胺基酸序列計算出自然摺疊的蛋白質結構。但是由於蛋白質多肽鏈可能的構象是個天文數字,現有的計算能力不可能搜尋整個構象空間,需採用一定的啟發式方法尋找自由能最優或接近於最優的構象。
蛋白質結構預測分為二級結構預測和空間結構預測。理論和實驗表明,不同的胺基酸殘基在不同的局域環境下具有形成特定二級結構的傾向性,因此在一定程度上二級結構的預測可以歸結為模式識別問題。二級結構預測的目標就是預測某一個片段中心的殘基是α螺旋,還是β摺疊,或是其它。在二級結構預測方面主要有以下幾種不同的方法,即立體化學方法、圖論方法、統計方法、最鄰近決策方法、基於規則的專家系統方法、分子動力學方法和人工神經網路方法。
在空間結構預測方面,比較成功的理論方法是同源模型法。該方法的依據是:相似序列的蛋白質傾向於摺疊成相似的三維空間結構。這樣,如果一個未知結構的蛋白質序列與另一個已知結構的蛋白質序列足夠相似,那么就可以根據後者為前者建立近似的三維結構模型。運用同源模型方法可以完成所有蛋白質10-30%的空間結構預測工作。得到蛋白質結構以後就可以進一步分析研究蛋白質的生物功能。

相關詞條

熱門詞條

聯絡我們