這些眾多的BI項目從規模和對BI系統支撐的完善程度上來說,大體可以分為Framework、Stand-alone Tools和BI Suit三種類型。
基本介紹
- 中文名:開源BI系統
- 類型:Framework、olsBI Suit等
- 套用工具:ETL工具、報表工具
- 分析工具:在線上分析處理工具等
簡介,套用工具,ETL工具,報表工具,報表功能,分析工具,資料庫,BI套件,Bizgres,Openi,Pentaho,SpagoBI,
簡介
開源BI系統分類
這些眾多的BI項目從規模和對BI系統支撐的完善程度上來說,大體可以分為Framework、Stand-alone Tools和BI Suit三種類型。
Framework
Stand-alone Tools
BI Suit
在統一的架構下提供了多種BI系統的特性的工具集合。不管是商業軟體還是開源軟體,還沒有任何一個套件提供了完整的端到端的BI解決方案。這些開源的BI Suit是通過連線多個其他的組件和工具的方式形成套件的,由於BI系統涉及到的工具是非常多的,所以整合一套完整的BI解決方案是很困難的。
BI解決方案中的工具
一個完整的BI解決方案中有多種工具來完成BI系統中各個階段的工作。
套用工具
BI可套用工具
ETL工具
1、 Workflow Management, Job Execution and Scheduling Manager。能方便地定義流程並自動化執行ETL任務。
3、 Data Profile and Validation。可以檢驗數據的質量。
4、 High Performance。在大負荷的任務執行中仍然有良好的性能。
6、 Open Architecture and API。具有開放的架構和易於使用的二次開發接口。
較為知名的開源ETL工具有:
1、 KETL,由具有IBM和KPMG背景的Kinetic Networks公司開發,已經有多年的產品套用歷史,成功套用於一些產品中,在點擊流(ClickStream)分析套用中表現出色。KETL採用Plug-in的架構,使用Java開發。
3、 Clover ETL,為一個基於Java的ETL Framework,可以用來開發自己的ETL套用。
報表工具
優秀的報表工具通常具有以下特性:
1、 支持多種數據源。
2、 直觀的可視化設計器,簡單易用的報表定製功能。
3、 方便的數據訪問和格式化,豐富的數據呈現方式。
4、 符合數據呈現的通用標準,能和應用程式很好地進行結合。
5、 易於擴展和部署。
較為知名的開源報表工具有:
1、 JasperReports,一個優秀的Java報表工具,始於2001,JasperSoft公司持續開發和支持該工具。該工具類似於商業軟體 Crystal Report,支持PDF、HTML、XLS、CSV和XML檔案輸出格式,現在是Java開發者最常用的報表工具。
2、 OpenReports,提供基於web的靈活報表解決方案,通過瀏覽器自動生成動態PDF,XLS,HTMLCSV 和Chart報表,它是用Java開發的,使用JasperReports 作為報表引擎,利用到的開源技術有Hibernate,Veloctiy,Webwork。
3、 JFreeReport,是Pentaho的一部分,它是一個優秀的用來生成報表的Java類庫。它為Java應用程式提供一個靈活的列印功能並支持輸出到印表機和PDF, Excel, HTML和XHTML, PlainText, XML和CSV檔案中。
報表功能
Eclipse BIRT
分析工具
OLAP工具
1、 良好的執行性能,能快速地進行分析處理工作。
2、 良好的適用性和可伸縮性。
3、 開放式接口和豐富的API。
較為知名的開源OLAP工具有:
1、 Mondrian,是Pentaho的一部分,為一個用Java開發的OLAP伺服器,實現了MDX語言、XML解析和JOLAP規範,可以不寫SQL就能分析存儲於SQL 資料庫的龐大數據集,可以封裝JDBC數據源並把數據以多維的方式展現出來。
2、JPivot,是一個JSP 自定製的標籤庫,可以繪製一個OLAP表格和圖表。用戶可以執行典型的OLAP導航,如下鑽,切片和方塊。它使用Mondrian 作為其OLAP伺服器。它使用WCF (Web Component Framework) ,基於XML/XSLT來渲染Web UI組件。JPivot在元數據快取方面的過於簡化的整體性初始化裝載的做法將限制它只能處理很小的立方體(Cube)。
資料庫
開源的資料庫也有很多,大多數為關係型資料庫,少數為套用於數據倉庫環境做了專門的最佳化工作。Bizgres以PostgreSQL為基礎進行了數據倉庫環境下的最佳化,提高了分析查詢性能。
BI套件
下面列出相對成熟和完整,並且有借鑑意義的開源BI套件。
Bizgres
Bizgree為GreenPlum公司主導的開源項目,和Sun公司達成合作關係。Bizgres為BI套用而對PostgreSQL做了最佳化,提高了大負荷的並行計算能力,在BI環境中,相對於普通的關係型資料庫具有卓越的數據處理性能。Bizgres的資料庫平台可以和KETL和JasperReports進行整合,從而形成一個BI套件:
1、 資料庫:BI專業資料庫Bizgres,或者大型套用中的高性能伺服器Bizgres MPP,能比普通關係資料庫快20倍
2、 ETL工具:KETL
3、報表工具:JasperReports
Openi
1、 OLAP展示:JPivot
2、報表工具:JFreeChart
3、 分析數據源連線器
Pentaho
Pentaho是一個以工作流為核心的、強調面向解決方案而非工具組件的BI套件,整合了多個開源項目,目標是和商業BI相抗衡。它包括:
1、工作流引擎:Shark and JaWE
2、 資料庫:Firebird RDBMS
3、 集成管理和開發環境:Eclipse
4、報表工具:Eclipse BIRT
5、 ETL工具:Enhydra/Kettle
6、 OLAP Server:Mondrian
7、 OLAP展示:JPivot
8、 數據挖掘組件:Weka
11、 自定義腳本支持:Mozilla Rhino Javascript腳本處理器
由上可見Pentaho是一個很完善的BI解決方案。Pentaho偏向於與業務流程相結合的BI解決方案,側重於大中型企業套用。
SpagoBI
SpagoBI是 集成了Mondrain和JProvit,能夠通過OpenLaszlo產生實時報表。SpagoBI使用java開發,不依賴於具體的作業系統,有很強的擴展能力。它主要包括:
1、 報表工具:JasperReports /Eclipse BIRT/ iReport
2、 OLAP Server:Mondrian
3、 OLAP展示:JPivot
4、 數據挖掘組件:Weka
5、 Map引擎:Geo
6、 ETL:BIE
7、 搜尋引擎:Lucene
8、 Dashboard:OpenLaszlo
9、 Portal Server:JBoss/ Tomcat/ JOnAS
根據其Roadmap可以看出,SpagoBI將融入更多的BI功能,甚至BI之外的功能。