多層組學整合分析是指對來自不同組學的數據源進行歸一化處理、比較分析,建立不同組間數據的關係,綜合多組學數據對生物過程從基因、轉錄、蛋白和代謝水平進行全面的深入的闡釋,從而更好的對生物系統進行全面了解。
基本介紹
- 中文名:多層組學整合
- 外文名:Multi-Omics Integration
組學介紹,為什麼需要多層組學整合?,整合分析研究思路,組學數據整合分析流程及內容,分析流程,兩層組學數據分析間的比較,不同組學數據作用分析,參考文獻,
組學介紹
組學(Omics)技術是隨著系統生物學的發展而迅速發展起來的,同時,組學技術又為系統生物學提供了海量的實驗數據和先進的技術方法,大大促進了系統生物學的發展。系統生物學是通過整合生物系統中諸多相互聯繫和作用的組分來研究複雜生物過程的機制,即研究生物系統中所有組成成分(基因、mRNA、蛋白質和代謝產物等)的構成以及在特定條件下這些組分間的相互作用和關係,並分析生物系統在某種或某些因素干預擾動下在一定時間內的動力學過程及其規律。 因此,它是一個由上而下的系統整合過程,即在深入研究基因和生物分子結構和功能基礎上的一種系統分析和整合。系統生物學將在基因組序列的基礎上完成由生命密碼到生命過程的研究,這是一個逐步整合的過程,由生物體內各種分子的鑑別及其相互作用的研究到途徑、網路、模組,最終完成整個生命活動的路線圖。
為什麼需要多層組學整合?
組學主要包括基因組學(Genomics)、轉錄組學(Transcriptomics)、蛋白質組學(Proteomics)和代謝組學(Metabolomics),高通量組學方法的套用產生了大量基因組、轉錄組、蛋白質組和代謝組等組學數據。組學數據的整合為全面了解生物學系統和機制提供了前提條件。
當前,單純研究某一層次生物分子(基因組、轉錄組、蛋白組和代謝組等)變化,如通過 gene ontology(GO)分析基因功能及相互作用網路,或通過 Metabo-Analyst分析小分子代謝產物的相互關係並找尋生物標誌物等,已經很難滿足系統生物學越來越高的研究期望。於是科學家提出應從多分子層次出發來系統研究基因、mRNA、蛋白質和小分子間的相互作用和系統機制。其中,生物體的通路分析就是一種十分重要的系統整合分析方法。
該方法通過基因組、轉錄組、蛋白組和代謝組實驗獲得應激擾動、病理生理狀態或藥物治療疾病後的變化信息,可富集和追索到變化最大、最集中的通路。通過對基因到 mRNA、蛋白質,再到體內小分子,對整體變化物質分子進行綜合分析,包括原始通路的分析及新通路的構建,反映出組織器官功能和代謝狀態,為探索生物調控分子機制、關鍵標誌物以及作用靶點提供新思路和新方法。
組學中數據整合的發展有待於實驗科學、分析科學、生物醫藥學、數學和計算機科學的全面進步,在實驗技術上提高產出數據的精度,在系統生物學上提供更多新的理論指導,在化學、數學和計算機領域提出更加強有力的分析計算方法,最終有效整合多層組學數據,對生物系統進行全面的解讀。
整合分析研究思路
隨著實驗技術特別是生物質譜技術的全面發展,獲取穩定可靠、數據量大的基因組、轉錄組、蛋白組和代謝組等高通量組學數據已經變得越來越簡單,而對這些組學數據的深入分析和解釋則變得越來越重要,尤其是對不同生物分子層次數據的整合分析。多層組學整合分析是指對來自基因組、轉錄組、蛋白組和代謝組等不同生物分子層次的批量數據進行歸一化處理、比較分析和相關性分析等統計學分析,建立不同層次分子間數據關係;同時結合GO功能分析、代謝通路富集、分子互作等生物功能分析,系統全面地解析生物分子功能和調控機制。不同分子層次的組學數據進行整合分析一方面可以相互驗證,另一方面也有助於相互補充、拓展認識。
多層組學整合分析的常見思路為:篩選各種目標生物分子,再根據系統生物學的功能層級邏輯,分析目標分子的功能,對轉錄,蛋白和代謝等數據根據協同網路協同調控邏輯進行整合分析。通過數據的整合分析,相互驗證補充,最終實現對生物變化大趨勢與方向的綜合了解,提出分子生物學變化機制模型,並篩選出重點代謝通路或者蛋白、基因、代謝產物進行後續深入實驗分析與套用。
組學數據整合分析流程及內容
圖中追溯了細胞中從基因組到代謝組的生物信號流,而已有的組學數據類型常常只關注中間變化過程。首先,DNA(基因組)被轉錄為mRNA(轉錄組),然後mRNA翻譯為蛋白(蛋白組),蛋白催化反應生成各種代謝物,比如糖蛋白和寡糖,以及不同的脂類(脂質組)。其中大部分成員可以在細胞中標記和定位(定位組)。產生和改變這些細胞成分的過程通常取決於分子相互作用(互作組),如轉錄過程中的蛋白—DNA相互作用、翻譯後的蛋白間相互作用以及酶相互作用等。最後,由代謝通路組成整合的網路或流量圖(代謝組),決定細胞動作或表型(表型組)。
分析流程
多層組學數據整合的任務可以歸納為3個層次的內容:第一,對兩個組學數據之間進行比較分析,挖掘數據之間的相關性和差異性;第二,給定3個或多個組學數據,挖掘它們之間的內在關係;第三,對於現存的所有組學數據,發展通用的數據整合方法和軟體,進行大規模的系統的數據整合。
兩層組學數據分析間的比較
兩層組學數據間的比較分析可以提示在複雜生物系統背後的作用機制,成為數據整合中人們普遍關注的問題。高通量轉錄組和蛋白組方法的發展為兩層組學數據的獲取提供了便利條件。由於轉錄組和蛋白組之間比較直接的對應關係,對於轉錄組和蛋白組之間的比較分析較多。不少的研究結果表明mRNA和蛋白表達相關性不高,說明存在豐富的轉錄後調控 。
不同組學數據作用分析
基因、mRNA 和蛋白提供了生物過程發生的物質基礎,而代謝組記錄了真實發生的生物化學反應。相對於轉錄組和蛋白組,在整合分析中代謝組往往可以提供更多的信息。轉錄組和蛋白組測量催化反應的酶的定量信息,而代謝組測量化學反應中底物和產物分子的代謝水平。
博苑(鹿明)生物作為國內最早開展多層組學整合研究服務的團隊之一,在多層組學特別是蛋白組和代謝組學實驗數據獲取與分析方面都有較豐富經驗。我們先後建立雙向電泳、iTRAQ和TMT等定量蛋白質組平台,建立了NMR、GC-MS和LC-MS等非靶向和靶向定量代謝組平台,參與開發了多層組學整合分析系統-組學金豆系統(omicsbean),在動植物抗逆抗病機制解析、分子標誌物發掘、基因功能分析、動植物激素及生理指標檢測等方面都有廣泛套用,期望為生命科學研究多貢獻自己的一份力量。
參考文獻
[1] Jeongsik, Ryun, Hong. Toward Systems Understanding of Leaf Senescence: An Integrated Multi-Omics Perspective on Leaf Senescence Research[J]. Molecular Plant, 2016, 9(6):813-825.
[2] Fondi M, Liò P. Multi-omics and metabolic modelling pipelines: challenges and tools for systems microbiology[J]. Microbiological research, 2015, 171: 52-64.
[3] 劉偉, 朱雲平, 賀福初. 系統生物學研究中不同組學數據的整合[J]. 中國生物化學與分子生物學報, 2007, 23(12):971-976.
[4] Wu J, Xu Z, Zhang Y, et al. An integrative analysis of the transcriptome and proteome of the pulp of a spontaneous late-ripening sweet orange mutant and, its wild type improves our understanding of fruit ripening in citrus[J]. Journal of Experimental Botany, 2014, 65(6):1651-1671.
[5] Chen Y, Pang Q Y, He Y, et al. Proteomics and metabolomics of Arabidopsis responses to perturbation of glucosinolate biosynthesis[J]. Molecular plant, 2012, 5(5): 1138-1150.
[6] Kim M, Rai N, Zorraquino V, et al. Multi-omics integration accurately predicts cellular state in unexplored conditions for Escherichia coli[J]. Nature Communications,2016,7.
[7] Shu L, Lou Q, Ma C, et al. Genetic, proteomic and metabolic analysis of the regulation of energy storage in rice seedlings in response to drought[J]. Proteomics. 2011, 11(21):4122-4138.