《Python數據可視化之Matplotlib與Pyecharts》是2020年清華大學出版社出版的圖書,作者是王國平。
基本介紹
- 書名:Python數據可視化之Matplotlib與Pyecharts
- 作者:王國平
- 出版社:清華大學出版社
- 出版時間:2020年6月1日
- 定價:68 元
- ISBN:9787302553557
內容簡介,圖書目錄,
內容簡介
本書以某上市電商企業的客戶數據、訂單數據、股價數據為基礎,由淺入深、循序漸進地介紹Python可視化技術,重點介紹Matplotlib與Pyecharts在數據可視化套用中的基本功能和使用技巧。全書以案例為主線,既包括軟體的操作與套用,又融入了數據可視化的基礎知識,繪圖案例大多選自工作實踐,可使讀者真正掌握專業的可視化方法與技巧,提升數據分析的整體能力。本書配套資源包含案例採用的數據源檔案、原始碼和教學視頻,供讀者在閱讀本書時進行操作練習和參考。
圖書目錄
第一部分 大數據可視化基礎
第1章 大數據可視化概述 2
1.1 大數據時代的技術挑戰 2
1.2 數據可視化的技術難點 3
1.3 可視化工具的必備特性 4
第2章 搭建大數據開發環境 5
2.1 集群的安裝及網路配置 5
2.1.1 Hadoop集群概述 5
2.1.2 集群軟體及其版本 6
2.1.3 集群網路環境配置 8
2.2 集群案例數據集簡介 10
2.2.1 數據欄位說明 10
2.2.2 數據導入說明 12
2.2.3 運行環境說明 13
2.3 連線Hive的圖形界面工具 13
2.3.1 DBeaver 13
2.3.2 Oracle SQL Developer 20
2.3.3 DbVisualizer 24
2.3.4 SQuirrel SQL Client 30
第3章 大數據可視化工具 38
3.1 Tableau 38
3.1.1 Tableau簡介 38
3.1.2 Tableau連線Hive 39
3.1.3 Tableau連線Spark 44
3.2 Zeppelin 48
3.2.1 Zeppelin簡介 48
3.2.2 Zeppelin連線Hive 48
3.2.3 Zeppelin連線Spark 55
3.3 Python在數據可視化中的套用 60
3.3.1 Python簡介 60
3.3.2 Python連線Hive 61
3.3.3 Python可視化案例 62
第4章 Python可視化編程基礎 65
4.1 Python環境安裝 65
4.1.1 Anaconda 65
4.1.2 PyCharm 71
4.2 Python代碼開發工具 80
4.2.1 Spyder 80
4.2.2 Jupyter Notebook 82
4.2.3 Jupyter Lab 86
4.3 Python連線數據源 90
4.3.1 連線單個檔案數據 90
4.3.2 連線關係型資料庫 97
4.3.3 連線Hadoop集群 101
第5章 Python數據可視化庫 104
5.1 Matplotlib 104
5.1.1 Matplotlib庫簡介 104
5.1.2 Matplotlib可視化案例 104
5.2 Pyecharts 106
5.2.1 Pyecharts庫簡介 106
5.2.2 Pyecharts可視化案例 107
5.3 Seaborn 108
5.3.1 Seaborn庫簡介 108
5.3.2 Seaborn可視化案例 108
5.4 ggplot 110
5.4.1 ggplot庫簡介 110
5.4.2 ggplot可視化案例 111
5.5 Bokeh 113
5.5.1 Bokeh庫簡介 113
5.5.2 Bokeh可視化案例 113
5.6 Pygal 115
5.6.1 Pygal庫簡介 115
5.6.2 Pygal可視化案例 115
5.7 Plotly 117
5.7.1 Plotly庫簡介 117
5.7.2 Plotly可視化案例 117
5.8 其他可視化庫 119
5.8.1 Altair 119
5.8.2 PyQtGraph 120
5.8.3 NetworkX 121
第二部分 Matplotlib數據可視化
第6章 Matplotlib圖形參數設定 124
6.1 Matplotlib主要參數配置 124
6.1.1 線條的設定 124
6.1.2 坐標軸的設定 127
6.1.3 圖例的設定 129
6.2 繪圖參數檔案及主要函式 132
6.2.1 修改繪圖參數檔案 132
6.2.2 繪圖主要函式簡介 133
6.3 Matplotlib參數配置案例 134
第7章 Matplotlib基礎繪圖 136
7.1 直方圖的繪製 136
7.1.1 直方圖及其參數說明 136
7.1.2 實例:每日利潤額的數值分布 137
7.2 折線圖的繪製 139
7.2.1 折線圖及其參數說明 139
7.2.2 實例:每周商品銷售業績分析 139
7.3 條形圖的繪製 141
7.3.1 條形圖及其參數說明 141
7.3.2 實例:不同省份利潤額的比較 141
7.4 餅圖的繪製 143
7.4.1 餅圖及其參數說明 143
7.4.2 實例:不同類型商品銷售額比較 144
7.5 散點圖的繪製 145
7.5.1 散點圖及其參數說明 145
7.5.2 實例:銷售額與利潤額的關係 146
7.6 箱形圖的繪製 148
7.6.1 箱形圖及其參數說明 148
7.6.2 實例:銷售經理業績比較分析 149
第8章 Matplotlib高級繪圖 151
8.1 樹形圖的繪製 151
8.1.1 樹形圖及其套用場景 151
8.1.2 實例:不同省份銷售額的比較分析 151
8.2 誤差條形圖的繪製 153
8.2.1 誤差條形圖及其套用場景 153
8.2.2 實例:門店業績考核達標情況分析 153
8.3 火柴桿圖的繪製 155
8.3.1 火柴桿圖及其套用場景 155
8.3.2 實例:不同省份送貨準時性分析 155
8.4 甘特圖的繪製 156
8.4.1 甘特圖及其套用場景 156
8.4.2 實例:企業信息化項目進度管理 157
8.5 自相關圖 160
8.5.1 自相關圖及其套用場景 160
8.5.2 實例:股票價格的自相關分析 160
8.6 圖形整合 163
8.6.1 圖形整合及其套用場景 163
8.6.2 實例:區域銷售額與利潤額分析 164
第三部分 Pyecharts數據可視化
第9章 Pyecharts圖形參數配置 168
9.1 全局配置項 168
9.1.1 基本元素配置項 168
9.1.2 坐標軸配置項 173
9.1.3 原生圖形配置項 176
9.2 系列配置項 179
9.2.1 樣式類配置項 179
9.2.2 標記類配置項 182
9.2.3 其他類配置項 185
9.3 運行環境 185
9.3.1 生成HTML 186
9.3.2 生成圖片 186
9.3.3 Jupyter Notebook 187
9.3.4 Jupyter Lab 187
第10章 Pyecharts基礎繪圖 189
10.1 折線圖的繪製 189
10.1.1 折線圖及其參數配置 189
10.1.2 實例:各門店銷售業績比較分析 190
10.2 條形圖的繪製 192
10.2.1 條形圖及其參數配置 192
10.2.2 實例:各省市商品訂單數量分析 194
10.3 箱形圖的繪製 196
10.3.1 箱形圖及其參數配置 196
10.3.2 實例:不同類型商品的收益分析 196
10.4 漣漪散點圖的繪製 198
10.4.1 漣漪散點圖及其參數配置 198
10.4.2 實例:不同收入等級客戶價值分析 199
10.5 K線圖的繪製 201
10.5.1 K線圖及其參數配置 201
10.5.2 實例:企業股票價格趨勢分析 201
10.6 雙坐標軸圖的繪製 203
10.6.1 雙坐標軸圖及其參數配置 203
10.6.2 實例:區域銷售業績及數量分析 203
第11章 Pyecharts高級繪圖 206
11.1 日曆圖的繪製 206
11.1.1 日曆圖及其參數配置 206
11.1.2 實例:企業股票每日交易量分析 207
11.2 漏斗圖的繪製 209
11.2.1 漏斗圖及其參數配置 209
11.2.2 實例:華東地區各省市利潤額分析 209
11.3 儀錶盤的繪製 211
11.3.1 儀錶盤及其參數配置 211
11.3.2 實例:企業2019年銷售業績完成率 211
11.4 環形圖的繪製 213
11.4.1 環形圖及其參數配置 213
11.4.2 實例:不同教育群體的購買力分析 213
11.5 雷達圖的繪製 215
11.5.1 雷達圖及其參數配置 215
11.5.2 實例:不同區域銷售業績的比較 216
11.6 旭日圖的繪製 218
11.6.1 旭日圖及其參數配置 218
11.6.2 實例:繪製我的家庭樹旭日圖 219
11.7 主題河流圖的繪製 221
11.7.1 主題河流圖及其參數配置 221
11.7.2 實例:不同類型商品銷售情況分析 222
11.8 詞雲的繪製 224
11.8.1 詞雲及其參數配置 224
11.8.2 實例:商品類型關鍵字詞雲 224
11.9 玫瑰圖的繪製 225
11.9.1 玫瑰圖及其參數配置 225
11.9.2 實例:不同職業群體的購買力分析 226
第12章 Web端的數據可視化 228
12.1 搭建Django開發環境 228
12.1.1 Django框架簡介 228
12.1.2 Django開發環境 229
12.2 Pyecharts與Django集成案例 230
12.2.1 創建項目運行環境 231
12.2.2 配置項目參數檔案 232
12.2.3 測試項目運行效果 236
附錄 集群各節點的參數配置 238
參考文獻 246