由中國科學院計算機網路信息中心、中國科學院植物研究所、深圳市中國科學院仙湖植物園“三方兩地”共同合作研究建設的DarwinTree:Molecular Data Analysis and Application Environment(達爾文樹:分子數據分析套用環境),突出生物科研和信息技術隊伍聯合攻關、加強生物信息技術在生物系統發育研究領域的作用、探索生物系統發育框架研究模式的套用,並從陸地植物開始逐漸拓展構建整個生物世界的TOL(Tree of Life)。平台旨在為科研人員提供簡便、快速、高效的數據分析平台,實現數據匯集和面向實際科研工作需求的雙重作用。
2009年5月建設以來,套用平台目前已實現面向整箇中國陸地植物的rbcL、atpB 和matK等(並根據用戶定製的熱點數據進行追加基因類型)基因數據從國際公共資料庫(NCBI、DDBJ、EMBL)的自動獲取、數據清洗,方便科研工作者實時了解當前數據狀況;擁有自測基因數據的提交、整理功能,保證科研成果未發表前的數據挖掘,從而實現公共、私有數據的結構化和整合化。平台實現系統樹的流程化構建,整合數據抽提、多序列比對、編輯清洗、分模型構樹、組裝評估、可視化編輯等一系列公認的分析算法和模型,通過若干互動界面,保證系統樹的自動生成、輔助實驗決策。平台結構圖如所示。科研工作者依託中科院網路信息中心的數據環境和計算環境,只需登入定製相關的研究範圍、分析模組和參數就可進行相應的數據套用和挖掘工作。
基本介紹
- 中文名:DarwinTree分子數據分析和套用環境
- 所屬:中國科學院計算機網路信息中心
- 特點:突出生物科研和信息技術
- 功能:為科研人員提供數據分析平台