DarwinTree分子數據分析和套用環境

中國科學院計算機網路信息中心、中國科學院植物研究所、深圳市中國科學院仙湖植物園“三方兩地”共同合作研究建設的DarwinTree:Molecular Data Analysis and Application Environment(達爾文樹:分子數據分析套用環境),突出生物科研和信息技術隊伍聯合攻關、加強生物信息技術在生物系統發育研究領域的作用、探索生物系統發育框架研究模式的套用,並從陸地植物開始逐漸拓展構建整個生物世界的TOL(Tree of Life)。平台旨在為科研人員提供簡便、快速、高效的數據分析平台,實現數據匯集和面向實際科研工作需求的雙重作用。

2009年5月建設以來,套用平台目前已實現面向整箇中國陸地植物的rbcL、atpB 和matK等(並根據用戶定製的熱點數據進行追加基因類型)基因數據從國際公共資料庫(NCBI、DDBJ、EMBL)的自動獲取、數據清洗,方便科研工作者實時了解當前數據狀況;擁有自測基因數據的提交、整理功能,保證科研成果未發表前的數據挖掘,從而實現公共、私有數據的結構化和整合化。平台實現系統樹的流程化構建,整合數據抽提、多序列比對、編輯清洗、分模型構樹、組裝評估、可視化編輯等一系列公認的分析算法和模型,通過若干互動界面,保證系統樹的自動生成、輔助實驗決策。平台結構圖如所示。科研工作者依託中科院網路信息中心的數據環境和計算環境,只需登入定製相關的研究範圍、分析模組和參數就可進行相應的數據套用和挖掘工作。

基本介紹

  • 中文名:DarwinTree分子數據分析和套用環境
  • 所屬:中國科學院計算機網路信息中心
  • 特點:突出生物科研和信息技術
  • 功能:為科研人員提供數據分析平台
內容簡介,使用方法,套用案例,持續發展,

內容簡介

DarwinTree 平台將根據用戶的數據和分析任務定製狀況,每天E-mail 傳送數據更新報告和分析任務結果報告。平台擁有基於注釋信息篩選和基於All-against-all BLAST 的序列篩選並行程式接口;平台目前集成多重序列分析(ClustalW (Emma)、ClustalW-MPI (local PC)、ClustalW-MPI (cluster) 等)、序列互動編輯工具(Jalview)、系統樹構建工具(ML、mrBayes、MP、NJ 等)、系統樹可視化工具(Archaeopteryx)以及可擴展的EMBOSS分析程式接口等。用戶可以:
訂閱Genbank 資料庫中,任一分類階元、任意物種範圍、多種格式(Genbank、fasta、XML 等)做後續分析;
套用不同的物種分類系統(NCBI taxonomy、APGII 等),也可以添加自己的分類系統進行數據組織;
定製平台資料庫中已篩選過的數據(根據用戶訂閱統計的熱點數據定期篩選加入);
對自測的序列數據進行質量評估和對DNA Barcoding 類序列數據進行物種鑑定;
選擇特定的分類階元和代表數據以及分析模型進行系統進化任務的一鍵式分析;
選擇任一分析工具或任幾個分析工具組合進行分析、其支持分析任務的“回滾”和中間分析結果查看。
DarwinTree分子數據分析和套用環境

使用方法

用戶註冊後成為普通用戶,可以進入自己的web 空間,擁有數據和分析子系統部分的功能。如需用戶升級需進行帳戶升級擁有更多功能。普通用戶在套用環境上工作流程和數據分析舉例示意工作圖如下所示。
DarwinTree分子數據分析和套用環境
A——B 示用戶登入平台(可以定製相關的數據範圍,查看研究現狀)
A 所示,1 用戶選擇已有的數據、2 選擇相應的參數(基因名稱、分類階元、代表序列數據、添加自測序列)、如選擇一鍵式計算(3 One-Key-Run)就可得到分類結果呈現(D)並保留各分析階段(C)的中間檔案;用戶選擇相應參數後,如選擇分步驟計算(3 Run-Extraction)就可以按照各分析階段(C 數據抽提、多重序列比對、編輯清洗、分模型構樹、組裝評估、可視化編輯)依模組進行進細化分析。

套用案例

目前,套用平台面向三個共建單位研究人員使用,進行面向中國陸地植物屬級水平上的分析、苔蘚植物、蕨類植物以及木蘭植物屬級、種級水平上的分析套用。

持續發展

隨著套用平台建設的深入,將逐步攻關解決系統發育分析相關的數據整合提取共享、流程化數據密集型高性能計算,提升套用平台的性能和權威性。DarwinTree 將逐步擴展套用範圍,從陸地植物到整個植物界,再到可面向整個生命時間的開放、共享、集成的工作平台。環境是開放性的,平台提取交匯系統發育分析相關的國際數據資源、整合相關的集成軟體。
平台項目組已和美國佛羅里達大學展開在世界陸地植物大框架研究分析方面的合作,並將逐步面向中國科學院研究團隊開放套用並開展廣泛合作。

相關詞條

熱門詞條

聯絡我們