《Python+Superset:商業智慧型數據分析與實戰》是電子工業出版社出版圖書,作者是王國平
通過實際案例深入介紹了基於Python的開源商業智慧型工具Apache Superset
基本介紹
- 書名:Python+Superset:商業智慧型數據分析與實戰
- 作者:王國平
- 出版社:電子工業出版社
- 出版時間:2022年3月
- 頁數:248 頁
- 定價:79 元
- 開本:16 開
- ISBN:9787121428654
內容簡介,圖書目錄,作者簡介,
內容簡介
立足於為企業建立一套開源免費的BI(商業智慧型)數據分析平台,實現自助數據處理、數據分析、數據可視化,概述了該系統的基本情況、總體需求、解決方案和業務理解等
zhua曲子白渡白顆
圖書目錄
第1章 商業智慧型概述
1.1 商業智慧型簡介
1.1.1 商業智慧型的發展
1.1.2 商業智慧型的價值
1.1.3 商業智慧型的流程
1.2 商業智慧型技術
1.2.1 數據倉庫技術
1.2.2 ETL技術
1.2.3 數據可視化技術
1.3 幾個概念的比較
1.3.1 商業智慧型與報表工具
1.3.2 商業智慧型與數據分析
1.3.3 商業智慧型與數據可視化
第2章 系統開發需求分析
2.1 項目背景概述
2.1.1 項目意義與需求
2.1.2 項目目標、系統設計與階段劃分
2.2 平台總體需求
2.2.1 平台總體規劃
2.2.2 平台用戶角色
2.3 解決方案概述
2.3.1 BI平台功能簡介
2.3.2 BI平台總體架構
2.4 業務數據理解
2.4.1 表及其欄位含義
2.4.2 重要需求點闡述
第3章 系統開發相關技術
3.1 系統主要軟體
3.1.1 Hadoop
3.1.2 Python
3.1.3 Apache Superset
3.2 數據倉庫技術
3.2.1 數據倉庫構建過程
3.2.2 數據倉庫拉鏈算法
3.3 Apache Superset的安裝
3.3.1 在Docker中部署Apache Superset
3.3.2 在Windows下安裝Apache Superset
第4章 Apache Superset連線數據源
4.1 讀取本地數據
4.1.1 讀取CSV檔案
4.1.2 讀取TXT檔案
4.2 連線關係型資料庫
4.2.1 安裝驅動程式
4.2.2 配置連線參數
4.2.3 添加資料庫表
第5章 Apache Superset基礎操作
5.1 Apache Superset可視化分析
5.1.1 SQL Lab提取數據
5.1.2 製作報表與看板
5.2 Apache Superset用戶管理
5.2.1 創建新的系統用戶
5.2.2 刪除已有系統用戶
5.2.3 查看用戶日誌記錄
5.3 Apache Superset角色管理
5.3.1 設定用戶角色類型
5.3.2 創建新的用戶角色
5.3.3 修改用戶角色類型
5.4 Apache Superset看板設定與編輯
5.4.1 Apache Superset看板設定
5.4.2 Apache Superset看板編輯
第6章 Apache Superset前端集成開發
6.1 前端開發概述
6.1.1 HTML及其套用案例
6.1.2 JavaScript及其特點
6.2 系統參數設定
6.3 Apache Superset前端集成實戰
6.3.1 報表嵌入Web頁面
6.3.2 看板嵌入Web頁面
第7章 Apache Superset系統性能最佳化
7.1 系統性能最佳化
7.2 搭建開發環境
7.2.1 Redis快取概述
7.2.2 配置Redis環境
7.3 集成開發實戰
7.3.1 測試集成前看板
7.3.2 刷新集成後看板
第8章 Apache Superset與數據倉庫
8.1 數據倉庫概述
8.1.1 傳統數據倉庫
8.1.2 大數據數據倉庫
8.2 Apache Superset集成Hive
8.2.1 Hive數據倉庫概述
8.2.2 搭建Hive開發環境
8.3 物流配送影響因素分析
第9章 Apache Superset與實時計算引擎
9.1 實時計算引擎概述
9.1.1 實時計算套用場景
9.1.2 實時計算重要架構
9.2 Apache Superset集成Presto
9.2.1 Presto計算引擎概述
9.2.2 搭建Presto開發環境
9.3 網購退貨原因分析
9.3.1 網購退貨主要原因
9.3.2 個人原因退貨分析
第10章 Apache Superset與列式存儲引擎
10.1 列式存儲引擎
10.2 Apache Superset集成Vertica
10.2.1 Vertica存儲引擎概述
10.2.2 搭建Vertica開發環境
10.3 客戶流失原因分析
10.3.1 客戶流失主要原因
10.3.2 客戶流失服務因素分析
第11章 Apache Superset與在線上分析處理
11.1 在線上分析處理概述
11.1.1 在線上分析處理特性
11.1.2 在線上分析處理操作
11.2 Apache Superset集成ClickHouse
11.2.1 ClickHouse存儲引擎概述
11.2.2 搭建ClickHouse開發環境
11.3 商家物流運營分析
11.3.1 物流運營主要模式
11.3.2 商家交貨周期分析
第12章 Apache Superset與混合事務分析處理
12.1 混合事務分析處理
12.1.1 混合事務分析處理概述
12.1.2 混合事務分析處理操作
12.2 Apache Superset集成TiDB
12.2.1 TiDB存儲引擎概述
12.2.2 搭建TiDB開發環境
12.3 物流配送溝通性
12.3.1 物流配送溝通性概述
12.3.2 物流配送溝通性分析
第13章 Apache Superset與數據湖引擎
13.1 數據湖引擎
13.1.1 數據湖引擎概述
13.1.2 數據湖與數據倉庫
13.2 Apache Superset集成Dremio
13.2.1 Dremio引擎概述
13.2.2 搭建Dremio開發環境
13.3 客戶流失價格因素
13.3.1 客戶流失價格因素概述
13.3.2 客戶流失價格因素分析
第14章 客戶細分主題分析
14.1 客戶細分的價值及其方法
14.1.1 客戶細分的概念
14.1.2 客戶細分的目的
14.1.3 客戶細分的方法
14.2 基於客戶屬性的客戶細分
14.2.1 提取SQL資料庫數據
14.2.2 製作可視化分析報表
14.2.3 基於屬性的細分看板
14.3 基於客戶價值的客戶細分
14.3.1 提取SQL資料庫數據
14.3.2 製作可視化分析報表
14.3.3 基於價值的細分看板
14.4 基於消費行為的客戶細分
14.4.1 RFM模型及客戶價值類型
14.4.2 提取與清洗SQL數據
14.4.3 製作可視化分析報表
14.4.4 基於行為的細分看板
14.5 對細分客戶進行行銷
第15章 客戶滿意度主題分析
15.1 客戶滿意度概述
15.2 客戶滿意信賴度分析
15.3 客戶滿意專業度分析
15.4 客戶滿意有形度分析
15.5 客戶滿意同理度分析
15.6 客戶滿意反應度分析
15.7 提升客戶滿意度
附錄A 安裝Python 3.10.0
附錄B 集群各節點的參數配置
B.1 Hadoop的參數配置
B.2 Hive的參數配置
B.3 集群的啟動與關閉
附錄C 數據源及其連線方式
作者簡介
王國平:具有十餘年金融、電力、網際網路等行業從業經歷,出版十餘部專著。擅長數據分析、數據可視化、機器學習等,精通Python、SPSS、Tableau、Power BI等數據分析工具,熟悉MySQL、SQL Server等資料庫,以及Hadoop、Hive、Zeppelin、Spark等大數據分析及可視化工具。