數據分析與數據可視化實戰

數據分析與數據可視化實戰

《數據分析與數據可視化實戰》是2020年5月電子工業出版社出版的圖書,作者是張延松,徐新哲。

基本介紹

  • 書名:數據分析與數據可視化實戰
  • 作者:張延松,徐新哲
  • ISBN:9787121379925
  • 出版社:電子工業出版社
  • 出版時間:2020年5月
  • 頁數:300
  • 字數:508千字
  • 開本:16開
  • 版次:01-01
內容簡介,圖書目錄,

內容簡介

本書以企業級基準數據集為實戰案例,系統地介紹了目前比較前沿、比較具有代表性的數據分析與數據可視化工具的使用方法,涵蓋了從數據管理到數據抓取、數據可視化、數據挖掘建模的整個企業級數據分析流程,使讀者能夠掌握企業級數據分析處理的基本技能,為承擔企業級數據分析處理或其他領域的相關任務打下基礎。本書可以作為經濟、人文、社會、管理學科學生學習數據分析與數據可視化技術的入門教材,也可以作為計算機專業、信息類專業本科生的教材或參考書,同樣也可以作為企業數據分析人員的參考書。

圖書目錄

目 錄
第一篇 預 備 篇
第1章 數據分析與資料庫的初步認識
1.1 數據分析的基本概念
1.1.1 大數據與數據價值
1.1.2 數據、數據分析與數據挖掘
1.1.3 數據可視化
1.1.4 數據驅動決策
1.1.5 數據分析師在企業中扮演的角色
1.2 資料庫的基本概念
1.2.1 企業級關係型資料庫
1.2.2 主鍵與外鍵
1.2.3 維度與度量
1.2.4 日期分區
1.3 數據分析的一般流程
1.3.1 定義數據分析目標
1.3.2 數據預處理
1.3.3 數據分析與模型搭建
1.3.4 數據產品上線與維護
本章小結
第2章 TPC-DS 數據分析案例簡介
2.1 數據集簡介
2.2 數據集結構解析
2.2.1 store sales網路
2.2.2 catalog sales網路
2.2.3 website sales網路
2.2.4 inventory網路
2.3 數據集欄位解析
2.3.1 事實表欄位解析
2.3.2 維度表欄位解析
2.4 啟示與挑戰
本章小結
第二篇 技 能 篇
第3章 企業級數據分析環境的搭建
3.1 SQL Server 2019 資料庫管理工具
3.1.1 SQL Server 2019 安裝與配置
3.1.2 新建TPC-DS 資料庫
3.1.3 通過數據導入嚮導導入 TPC-DS 數據集
3.1.4 通過 Bulk Insert 命令導入 TPC-DS 數據集
3.1.5 通過數據導出嚮導導出數據
3.2 Excel Power 外掛程式數據分析工具
3.2.1 Excel Power 外掛程式的調用
3.2.2 Power Pivot 連線 SQL Server 2019資料庫
3.2.3 Power View 與 Power Map的調用
3.3 Power BI Desktop 數據分析工具
3.3.1 Power BI Desktop 簡介與安裝
3.3.2 Power BI Desktop 連線 SQL Server 2019 資料庫
3.4 Tableau Desktop & Prep 數據分析工具
3.4.1 Tableau Desktop & Prep 安裝與配置
3.4.2 Tableau Desktop 連線 SQL Server 2019 資料庫
3.4.3 Tableau Prep 套用基礎
3.5 Python數據分析工具
3.5.1 Python簡介與安裝
3.5.2 Python 連線 SQL Server 2019 資料庫
3.5.3 通過 Python 代碼導入 TPC-DS 數據集
本章小結
第4章 結構化查詢語言SQL
4.1 SQL數據查詢概述
4.2 單表查詢
4.2.1 投影操作
4.2.2 選擇操作
4.2.3 聚集操作
4.2.4 分組操作
4.2.5 排序操作
4.3 連線查詢
4.3.1 等值、非等值連線
4.3.2 自身連線
4.3.3 外連線
4.3.4 多表連線
4.4 嵌套查詢
4.4.1 包含in謂詞的子查詢
4.4.2 帶有比較運算符的相關子查詢
4.4.3 帶有any或all謂詞的子查詢
4.4.4 帶有exist謂詞的子查詢
4.5 集合查詢
4.5.1 集合併運算
4.5.2 集合交運算
4.5.3 集合差運算
4.5.4 多值列集合差運算
4.6 基於派生表的查詢
4.7 複雜查詢案例解析
4.7.1 複雜查詢案例1
4.7.2 複雜查詢案例2
4.7.3 複雜查詢案例3
4.7.4 複雜查詢案例4
4.7.5 複雜查詢案例5
4.8 SQL 語言的其他功能
4.8.1 數據定義 SQL
4.8.2 數據更新 SQL
4.8.3 視圖的定義和使用
本章小結
第5章 數據可視化基礎
5.1 工作界面布局
5.2 基本可視化組件
5.2.1 堆積條形圖
5.2.2 簇狀條形圖
5.2.3 折線圖
5.2.4 組合圖
5.2.5 餅狀圖與環狀圖
5.2.6 表格與矩陣
5.2.7 儀表與卡片
5.2.8 基本可視化套用小結
5.3 進階可視化組件
5.3.1 排名圖
5.3.2 瀑布圖
5.3.3 樹狀圖
5.3.4 直方圖
5.3.5 盒須圖
5.3.6 散點圖
5.3.7 詞雲圖
5.3.8 弦圖與桑基圖
5.3.9 R & Python視覺對象
5.3.10 進階可視化套用小結
5.4 分析板塊的套用
5.4.1 匯總功能
5.4.2 模型功能
5.4.3 自定義功能
5.5 儀錶板與故事
5.5.1 創建儀錶板
5.5.2 創建故事
本章小結
第三篇 實 戰 篇
第6章 用戶數據分析與挖掘實戰
6.1 引言
6.2 用戶巨觀監控儀錶板設計
6.2.1 設計目的
6.2.2 可視化效果
6.2.3 組件介紹
6.2.4 小結
6.3 用戶微觀監控儀錶板設計
6.3.1 設計目的
6.3.2 可視化效果
6.3.3 組件介紹
6.3.4 小結
6.4 用戶價值識別模型(RFM模型)
6.4.1 背景簡介
6.4.2 目標定義與數據獲取
6.4.3 數據預處理與分析
6.4.4 建立模型
6.4.5 模型評價與套用
6.4.6 小結
6.5 用戶優惠券使用行為預測模型
6.5.1 背景簡介
6.5.2 目標定義與特徵工程
6.5.3 數值質量診斷與變數描述性統計
6.5.4 數據預處理
6.5.5 模型建立與效果評估
6.5.6 小結
本章小結
第7章 供應鏈數據分析與挖掘實戰
7.1 引言
7.2 用戶偏好維度供應鏈監控儀錶板設計
7.2.1 設計目的
7.2.2 可視化效果
7.2.3 組件介紹
7.2.4 小結
7.3 用戶滿足維度供應鏈監控儀錶板設計
7.3.1 設計目的
7.3.2 可視化效果
7.3.3 組件介紹
7.3.4 小結
7.4 產品需求量預測模型
7.4.1 背景簡介
7.4.2 數據準備
7.4.3 數據預分析
7.4.4 產品行為模式聚類
7.4.5 時間序列建模與效果評估
7.4.6 小結
本章小結

相關詞條

熱門詞條

聯絡我們