Apache Doris

Apache Doris

Apache Doris是由百度自主研發並開源的一款MPP分析型資料庫產品,僅需亞秒級回響時間即可獲得查詢結果,有效地支持實時數據分析。Apache Doris的分散式架構非常簡潔,易於運維,並且可以支持10PB以上的超大數據集。

基本介紹

  • 軟體名稱:Apache Doris
  • 授權協定:Apache License v2.0
  • 開發語言:Java C/C++
  • 軟體類別:基於MPP的分析型資料庫
Apache Doris概述,Apache Doris特性,Apache Doris技術原理,適用場景,相關產品,

Apache Doris概述

Apache Doris前身是百度Palo,是百度開船射榜乃發的面向線上報表和分析的數據倉庫系統,可以對標於商業的MPP數據倉庫系統,比如Greenplum、Vertica、盼烏謎櫃Teradata等。
Apache Doris (incubating)是一款百度大數據團隊自主研發的MPP資料庫,其臭戒備功能和性能已達到或超過國內外同類產品。自2017年在GitHub上開源以來,先後被漏辣剃小米、美團、鏈家、品友互動、瓜子、搜狐等十多家網際網路公司使用。同時,Doris 在公司內部署超過1000台機器,服務超200業務,單業務最大容量2PB;在百度雲上,Doris作為大數據分析工具中的數據倉庫有著廣泛的用戶。2018年7月,Doris獲得了全球著名開源社區Apache基金會的認可,通過投票成功進入Apache孵化器。之後將通過社區的力量,提供更加穩定、高效、易用的數據倉庫服務。
Apache Doris可以滿足多種數據分析需求,例如固定歷史報表,實時數據分析,互動式數據分析和探索式數據分析等,令辯立才數據分析工作簡單高效。

Apache Doris特性

現代化MPP架構
亞秒級查詢返回延遲
支持標準SQL語言,兼容MySQL協定
向量化執行引擎
高效的聚合表技術
新型預聚合技術Rollup
極簡運維、彈性伸縮

Apache Doris技術原理

ApacheDoris 主要基於C++ 和Java 開發,集成了Google Mesa 和芝槳Apache Impala 的技術。將Mesa 與Impala進行組合的基礎上,Doris 被設計為一個不依賴於其他系統的簡單且單一緊密耦合的系統,並實現了MySQL協定,使得用戶可以像使用MySQL 無縫過渡到Doris,包括各種報表套用都可以通過MySQL協定連線Doris,同時獲得高並發低延遲點查詢性能,而且還能進行高吞吐量的即席分析查詢。Doris 不僅提供大批量數據載入,牛妹習而且還提供近乎實時的小批量,甚至流數據載入。此外Doris還具備可用性,可靠性,容錯性和可擴展性。

適用場景

Doris適用場景主要包括:
(1)高並發的點查詢場景;
(2)高吞吐的即席查詢
(3)BI報表分析
(4)實時查詢
Doris 支持本地檔案、實時數據和HDFS檔案的導入,通過兼容MySQL協定,用戶可以將原來通過各種主流BI工具和可視化平台業務切換到Doris,改為直接連線Doris集群。

相關產品

百度數據倉庫Palo是由Apache Doris核心研發團隊在百度雲上提供的基於Apache Doris 的數據倉庫服務,可以面向企業級用戶提供全託管的數倉體驗,同時也支持多雲及私有化部署。

相關詞條

熱門詞條

聯絡我們