數據可視化——從小白到數據工程師的成長之路

數據可視化——從小白到數據工程師的成長之路

《數據可視化——從小白到數據工程師的成長之路》是2019年11月電子工業出版社出版的圖書,作者是劉英華。

基本介紹

  • 中文名:數據可視化——從小白到數據工程師的成長之路
  • 作者:劉英華
  • ISBN:9787121362231
  • 頁數:252
  • 定價:¥52.0
  • 出版社:電子工業出版社
  • 出版時間:2019年11月
  • 開本:16開
內容簡介,目錄,

內容簡介

掌握數據可視化技術是未來工作和學習的必備能力,是展示理念和成果的重要手段永歸戶朵。閱讀並完成本書的實踐,你將快速地學會數據獲取、清洗、分析、可視化及發布的完整流程。本挨戲汽書以豐富的實踐案例解析數據可視化的製作理念和具體方法,緊密圍繞當前數據可視化領域的實際需求,全面介紹數據可視化的概念和技巧。本書包含基礎知識、數據獲取、數據清洗、數據分析、可視化基礎和原則、數據可視化工具和可視化作品發布等內容,基於具體案例多角度啟發和引導讀者的創新思維,增強讀者對抽象數據的把握及綜合可視化能力的提升。本書內容通俗易懂,簡明實用,配套的教學輔助資料可免費下載。本書適合零編程拒漏套基礎的數據可視化從業者和高校師生閱讀,有一定工作經驗的數據可視化工程師也可以從本書中學到大量實用的技能。

目錄

第1章 基礎知識 1
1.1 模擬和數位化 1
1.2 數模轉換 1
1.3 進制 2
1.4 存儲單位 3
1.5 網際網路 3
1.6 地址和協定 4
1.7 域名和域名系統 6
1.8 網路速率 6
1.9 數據可視化 7
小結 7
習題1 7
第2章 數據獲取 8
2.1 知識共享許可協定 8
2.2 搜尋數據 9
2.2.1 搜尋引擎 10
2.2.2 瀏覽器 11
2.2.3 搜尋指令 11
2.3 主動公開的數據 15
2.3.1 我國政府數據 15
2.3.2 國際組織數據 17
2.3.3 科研機構及第三方數據公司 17
2.4 依申請公開數據 17
2.5 數據眾包 18
2.6 抓取工具 18
2.6.1 import.io工具 20
2.6.2 Octoparse工具 23
2.7 Python基礎 33
2.7.1 環境配置 33
2.7.2 第一個Python程式 35
2.7.3 變數和運算符 36
2.7.4 條件語句 43
2.7.5 循環語句 45
2.7.6 輸入和輸出 48
2.7.7 檔案的讀/寫 49
2.8 Beautiful Soup庫 51
2.8.1 安裝Beautiful Soup 51
2.8.2 使用Beautiful Soup抓取網頁數據 52
2.9 圖片的獲取 56
2.9.1 常用的圖片編輯軟體 56
2.9.3 圖片檔案的保存 58
2.10 音頻的獲取 59
2.10.1 常用的音頻編輯軟體 60
2.10.2 音頻檔案類型及保存 61
2.11 視頻承束的獲取戒榜邀符 62
2.11.1 常用的視頻編輯軟體 62
2.11.2 視頻檔案類型 63
2.11.3 視頻檔案的保存 63
2.12 數據格式轉換 64
2.12.1 數字圖鍵項試片的格式轉換 65
2.12.2 數字音頻的格式轉換 67
2.12.3 數字視頻的格式轉換 68
2.12.4 檔案格式轉換 68
2.12.5 可機讀數據 70
小結 70
習題2 70
第3章 數據清洗 71
3.1 Jupyter Notebook 71
3.1.1 安裝Jupyter Notebook 72
3.1.2 啟動、關閉notebook伺服器 72
3.1.3 保存notebook 75
3.2 Pandas包 75
3.2.1 系列(Series) 75
3.2.2 數據幀(DataFrame) 78
3.3 清洗缺失值 80
3.3.1 檢查缺失值 80
3.3.2 刪除含缺失值的行或列 82
3.3.3 填充缺失值 82
3.4 清洗格式內容 84
3.4.1 刪除蒸抹遙字元串中的空格 84
3.4.2 大小寫轉換 85
3.4.3 規範數據格式 87
3.4.4 字元型數據判斷 87
?
3.5 清洗邏輯錯誤 88
3.5.1 刪除重複記錄 88
3.5.2 替換不合理值 89
3.6 刪除非需求數據 90
3.6.1 刪除非需求行 90
3.6.2 刪除非需求列 90
3.7 分組、合併和保存 91
3.7.1 分組 91
3.7.2 數據合併 92
3.7.3 保存結果 96
3.8 數據清洗案例 97
3.8.1 案例1 97
3.8.2 案例2 102
小結 104
習題3 104
第4章 數據分析 105
4.1 數據定位 105
4.1.1 了解基本數據 105
4.1.2 使用[ ]定位 107
4.1.3 使用loc[ ]定位 108
4.1.4 使用iloc[ ]定位 110
4.1.5 使用iat[ ]定位 112
4.2 條件篩選和排序數據 113
4.2.1 條件篩選 113
4.2.2 排序和排名 117
4.3 數據的描述性分析 121
4.3.1 describe( )方法 121
4.3.2 眾數、均值和中位數 123
4.3.3 數據重塑 124
4.3.4 相關性計算 131
小結 132
習題4 132
第5章 可視化基礎和原則 133
5.1 圖表 135
5.1.1 圖表的種類 135
5.1.2 圖表設計原則 142
5.2 色彩暗示 152
5.2.1 色調 152
5.2.2 明度 153
5.2.3 飽和度 154
5.2.4 色彩暗示的綜合運用 155
5.3 圖表可視化原則 156
5.3.1 “第一眼”原則 156
5.3.2 數據不是敵人 157
5.3.3 刪減無關的元素 157
5.3.4 慎用3D圖表 159
5.3.5 視覺暗示的使用 160
5.3.6 整體變個體 161
5.3.7 互動圖表原則 162
5.3.8 顯示上下文 164
5.4 圖表可視化的失敗案例 165
5.5 設計排版原則 168
5.5.1 順序 168
5.5.2 標註 171
5.5.3 動畫效果 171
5.5.4 分組 173
5.5.5 賦形 173
小結 174
習題5 175
第6章 數據可視化工具 176
6.1 信息圖製作工具 176
6.2 可視化工具Gapminder 179
6.3 可視化工具DataWrapper 181
6.4 可視化工具Gephi 188
6.5 可視化工具QGIS 194
6.6 可視化工具ECharts 201
6.6.1 五分鐘上手ECharts 201
6.6.2 第一個ECharts作品 202
6.6.3 使用ECharts主題 206
6.7 可視化工具Tableau 207
6.7.1 安裝和簡介 208
6.7.2 連線數據 209
6.7.3 工作表 209
6.7.4 儀錶板 210
6.7.5 故事 211
6.7.6 保存和導出 211
6.8 用Python和R實現可視化 215
小結 217
習題6 218
?
第7章 可視化作品發布 219
7.1 網路基礎知識 219
7.2 HTML5基礎 220
7.2.1 HTML文檔 220
7.2.2 HTML常用標籤 221
7.3 CSS3基礎 225
7.3.1 內部CSS 225
7.3.2 外部CSS 228
7.4 JavaScript基礎 229
7.4.1 直接嵌入HTML使用 230
7.4.2 在HTML中調用 230
7.5 Web套用框架和模板 231
7.5.1 Web套用框架 231
7.5.2 Web模板 233
小 結 234
習 題 7 234
附錄A 數據可視化作品 235
附錄B 配套教學資源二維碼 237
參考文獻 238,
第1章 基礎知識 1
1.1 模擬和數位化 1
1.2 數模轉換 1
1.3 進制 2
1.4 存儲單位 3
1.5 網際網路 3
1.6 地址和協定 4
1.7 域名和域名系統 6
1.8 網路速率 6
1.9 數據可視化 7
小結 7
習題1 7
第2章 數據獲取 8
2.1 知識共享許可協定 8
2.2 搜尋數據 9
2.2.1 搜尋引擎 10
2.2.2 瀏覽器 11
2.2.3 搜尋指令 11
2.3 主動公開的數據 15
2.3.1 我國政府數據 15
2.3.2 國際組織數據 17
2.3.3 科研機構及第三方數據公司 17
2.4 依申請公開數據 17
2.5 數據眾包 18
2.6 抓取工具 18
2.6.1 import.io工具 20
2.6.2 Octoparse工具 23
2.7 Python基礎 33
2.7.1 環境配置 33
2.7.2 第一個Python程式 35
2.7.3 變數和運算符 36
2.7.4 條件語句 43
2.7.5 循環語句 45
2.7.6 輸入和輸出 48
2.7.7 檔案的讀/寫 49
2.8 Beautiful Soup庫 51
2.8.1 安裝Beautiful Soup 51
2.8.2 使用Beautiful Soup抓取網頁數據 52
2.9 圖片的獲取 56
2.9.1 常用的圖片編輯軟體 56
2.9.3 圖片檔案的保存 58
2.10 音頻的獲取 59
2.10.1 常用的音頻編輯軟體 60
2.10.2 音頻檔案類型及保存 61
2.11 視頻的獲取 62
2.11.1 常用的視頻編輯軟體 62
2.11.2 視頻檔案類型 63
2.11.3 視頻檔案的保存 63
2.12 數據格式轉換 64
2.12.1 數字圖片的格式轉換 65
2.12.2 數字音頻的格式轉換 67
2.12.3 數字視頻的格式轉換 68
2.12.4 檔案格式轉換 68
2.12.5 可機讀數據 70
小結 70
習題2 70
第3章 數據清洗 71
3.1 Jupyter Notebook 71
3.1.1 安裝Jupyter Notebook 72
3.1.2 啟動、關閉notebook伺服器 72
3.1.3 保存notebook 75
3.2 Pandas包 75
3.2.1 系列(Series) 75
3.2.2 數據幀(DataFrame) 78
3.3 清洗缺失值 80
3.3.1 檢查缺失值 80
3.3.2 刪除含缺失值的行或列 82
3.3.3 填充缺失值 82
3.4 清洗格式內容 84
3.4.1 刪除字元串中的空格 84
3.4.2 大小寫轉換 85
3.4.3 規範數據格式 87
3.4.4 字元型數據判斷 87
?
3.5 清洗邏輯錯誤 88
3.5.1 刪除重複記錄 88
3.5.2 替換不合理值 89
3.6 刪除非需求數據 90
3.6.1 刪除非需求行 90
3.6.2 刪除非需求列 90
3.7 分組、合併和保存 91
3.7.1 分組 91
3.7.2 數據合併 92
3.7.3 保存結果 96
3.8 數據清洗案例 97
3.8.1 案例1 97
3.8.2 案例2 102
小結 104
習題3 104
第4章 數據分析 105
4.1 數據定位 105
4.1.1 了解基本數據 105
4.1.2 使用[ ]定位 107
4.1.3 使用loc[ ]定位 108
4.1.4 使用iloc[ ]定位 110
4.1.5 使用iat[ ]定位 112
4.2 條件篩選和排序數據 113
4.2.1 條件篩選 113
4.2.2 排序和排名 117
4.3 數據的描述性分析 121
4.3.1 describe( )方法 121
4.3.2 眾數、均值和中位數 123
4.3.3 數據重塑 124
4.3.4 相關性計算 131
小結 132
習題4 132
第5章 可視化基礎和原則 133
5.1 圖表 135
5.1.1 圖表的種類 135
5.1.2 圖表設計原則 142
5.2 色彩暗示 152
5.2.1 色調 152
5.2.2 明度 153
5.2.3 飽和度 154
5.2.4 色彩暗示的綜合運用 155
5.3 圖表可視化原則 156
5.3.1 “第一眼”原則 156
5.3.2 數據不是敵人 157
5.3.3 刪減無關的元素 157
5.3.4 慎用3D圖表 159
5.3.5 視覺暗示的使用 160
5.3.6 整體變個體 161
5.3.7 互動圖表原則 162
5.3.8 顯示上下文 164
5.4 圖表可視化的失敗案例 165
5.5 設計排版原則 168
5.5.1 順序 168
5.5.2 標註 171
5.5.3 動畫效果 171
5.5.4 分組 173
5.5.5 賦形 173
小結 174
習題5 175
第6章 數據可視化工具 176
6.1 信息圖製作工具 176
6.2 可視化工具Gapminder 179
6.3 可視化工具DataWrapper 181
6.4 可視化工具Gephi 188
6.5 可視化工具QGIS 194
6.6 可視化工具ECharts 201
6.6.1 五分鐘上手ECharts 201
6.6.2 第一個ECharts作品 202
6.6.3 使用ECharts主題 206
6.7 可視化工具Tableau 207
6.7.1 安裝和簡介 208
6.7.2 連線數據 209
6.7.3 工作表 209
6.7.4 儀錶板 210
6.7.5 故事 211
6.7.6 保存和導出 211
6.8 用Python和R實現可視化 215
小結 217
習題6 218
?
第7章 可視化作品發布 219
7.1 網路基礎知識 219
7.2 HTML5基礎 220
7.2.1 HTML文檔 220
7.2.2 HTML常用標籤 221
7.3 CSS3基礎 225
7.3.1 內部CSS 225
7.3.2 外部CSS 228
7.4 JavaScript基礎 229
7.4.1 直接嵌入HTML使用 230
7.4.2 在HTML中調用 230
7.5 Web套用框架和模板 231
7.5.1 Web套用框架 231
7.5.2 Web模板 233
小 結 234
習 題 7 234
附錄A 數據可視化作品 235
附錄B 配套教學資源二維碼 237
參考文獻 238
2.10 音頻的獲取 59
2.10.1 常用的音頻編輯軟體 60
2.10.2 音頻檔案類型及保存 61
2.11 視頻的獲取 62
2.11.1 常用的視頻編輯軟體 62
2.11.2 視頻檔案類型 63
2.11.3 視頻檔案的保存 63
2.12 數據格式轉換 64
2.12.1 數字圖片的格式轉換 65
2.12.2 數字音頻的格式轉換 67
2.12.3 數字視頻的格式轉換 68
2.12.4 檔案格式轉換 68
2.12.5 可機讀數據 70
小結 70
習題2 70
第3章 數據清洗 71
3.1 Jupyter Notebook 71
3.1.1 安裝Jupyter Notebook 72
3.1.2 啟動、關閉notebook伺服器 72
3.1.3 保存notebook 75
3.2 Pandas包 75
3.2.1 系列(Series) 75
3.2.2 數據幀(DataFrame) 78
3.3 清洗缺失值 80
3.3.1 檢查缺失值 80
3.3.2 刪除含缺失值的行或列 82
3.3.3 填充缺失值 82
3.4 清洗格式內容 84
3.4.1 刪除字元串中的空格 84
3.4.2 大小寫轉換 85
3.4.3 規範數據格式 87
3.4.4 字元型數據判斷 87
?
3.5 清洗邏輯錯誤 88
3.5.1 刪除重複記錄 88
3.5.2 替換不合理值 89
3.6 刪除非需求數據 90
3.6.1 刪除非需求行 90
3.6.2 刪除非需求列 90
3.7 分組、合併和保存 91
3.7.1 分組 91
3.7.2 數據合併 92
3.7.3 保存結果 96
3.8 數據清洗案例 97
3.8.1 案例1 97
3.8.2 案例2 102
小結 104
習題3 104
第4章 數據分析 105
4.1 數據定位 105
4.1.1 了解基本數據 105
4.1.2 使用[ ]定位 107
4.1.3 使用loc[ ]定位 108
4.1.4 使用iloc[ ]定位 110
4.1.5 使用iat[ ]定位 112
4.2 條件篩選和排序數據 113
4.2.1 條件篩選 113
4.2.2 排序和排名 117
4.3 數據的描述性分析 121
4.3.1 describe( )方法 121
4.3.2 眾數、均值和中位數 123
4.3.3 數據重塑 124
4.3.4 相關性計算 131
小結 132
習題4 132
第5章 可視化基礎和原則 133
5.1 圖表 135
5.1.1 圖表的種類 135
5.1.2 圖表設計原則 142
5.2 色彩暗示 152
5.2.1 色調 152
5.2.2 明度 153
5.2.3 飽和度 154
5.2.4 色彩暗示的綜合運用 155
5.3 圖表可視化原則 156
5.3.1 “第一眼”原則 156
5.3.2 數據不是敵人 157
5.3.3 刪減無關的元素 157
5.3.4 慎用3D圖表 159
5.3.5 視覺暗示的使用 160
5.3.6 整體變個體 161
5.3.7 互動圖表原則 162
5.3.8 顯示上下文 164
5.4 圖表可視化的失敗案例 165
5.5 設計排版原則 168
5.5.1 順序 168
5.5.2 標註 171
5.5.3 動畫效果 171
5.5.4 分組 173
5.5.5 賦形 173
小結 174
習題5 175
第6章 數據可視化工具 176
6.1 信息圖製作工具 176
6.2 可視化工具Gapminder 179
6.3 可視化工具DataWrapper 181
6.4 可視化工具Gephi 188
6.5 可視化工具QGIS 194
6.6 可視化工具ECharts 201
6.6.1 五分鐘上手ECharts 201
6.6.2 第一個ECharts作品 202
6.6.3 使用ECharts主題 206
6.7 可視化工具Tableau 207
6.7.1 安裝和簡介 208
6.7.2 連線數據 209
6.7.3 工作表 209
6.7.4 儀錶板 210
6.7.5 故事 211
6.7.6 保存和導出 211
6.8 用Python和R實現可視化 215
小結 217
習題6 218
?
第7章 可視化作品發布 219
7.1 網路基礎知識 219
7.2 HTML5基礎 220
7.2.1 HTML文檔 220
7.2.2 HTML常用標籤 221
7.3 CSS3基礎 225
7.3.1 內部CSS 225
7.3.2 外部CSS 228
7.4 JavaScript基礎 229
7.4.1 直接嵌入HTML使用 230
7.4.2 在HTML中調用 230
7.5 Web套用框架和模板 231
7.5.1 Web套用框架 231
7.5.2 Web模板 233
小 結 234
習 題 7 234
附錄A 數據可視化作品 235
附錄B 配套教學資源二維碼 237
參考文獻 238,
第1章 基礎知識 1
1.1 模擬和數位化 1
1.2 數模轉換 1
1.3 進制 2
1.4 存儲單位 3
1.5 網際網路 3
1.6 地址和協定 4
1.7 域名和域名系統 6
1.8 網路速率 6
1.9 數據可視化 7
小結 7
習題1 7
第2章 數據獲取 8
2.1 知識共享許可協定 8
2.2 搜尋數據 9
2.2.1 搜尋引擎 10
2.2.2 瀏覽器 11
2.2.3 搜尋指令 11
2.3 主動公開的數據 15
2.3.1 我國政府數據 15
2.3.2 國際組織數據 17
2.3.3 科研機構及第三方數據公司 17
2.4 依申請公開數據 17
2.5 數據眾包 18
2.6 抓取工具 18
2.6.1 import.io工具 20
2.6.2 Octoparse工具 23
2.7 Python基礎 33
2.7.1 環境配置 33
2.7.2 第一個Python程式 35
2.7.3 變數和運算符 36
2.7.4 條件語句 43
2.7.5 循環語句 45
2.7.6 輸入和輸出 48
2.7.7 檔案的讀/寫 49
2.8 Beautiful Soup庫 51
2.8.1 安裝Beautiful Soup 51
2.8.2 使用Beautiful Soup抓取網頁數據 52
2.9 圖片的獲取 56
2.9.1 常用的圖片編輯軟體 56
2.9.3 圖片檔案的保存 58
2.10 音頻的獲取 59
2.10.1 常用的音頻編輯軟體 60
2.10.2 音頻檔案類型及保存 61
2.11 視頻的獲取 62
2.11.1 常用的視頻編輯軟體 62
2.11.2 視頻檔案類型 63
2.11.3 視頻檔案的保存 63
2.12 數據格式轉換 64
2.12.1 數字圖片的格式轉換 65
2.12.2 數字音頻的格式轉換 67
2.12.3 數字視頻的格式轉換 68
2.12.4 檔案格式轉換 68
2.12.5 可機讀數據 70
小結 70
習題2 70
第3章 數據清洗 71
3.1 Jupyter Notebook 71
3.1.1 安裝Jupyter Notebook 72
3.1.2 啟動、關閉notebook伺服器 72
3.1.3 保存notebook 75
3.2 Pandas包 75
3.2.1 系列(Series) 75
3.2.2 數據幀(DataFrame) 78
3.3 清洗缺失值 80
3.3.1 檢查缺失值 80
3.3.2 刪除含缺失值的行或列 82
3.3.3 填充缺失值 82
3.4 清洗格式內容 84
3.4.1 刪除字元串中的空格 84
3.4.2 大小寫轉換 85
3.4.3 規範數據格式 87
3.4.4 字元型數據判斷 87
?
3.5 清洗邏輯錯誤 88
3.5.1 刪除重複記錄 88
3.5.2 替換不合理值 89
3.6 刪除非需求數據 90
3.6.1 刪除非需求行 90
3.6.2 刪除非需求列 90
3.7 分組、合併和保存 91
3.7.1 分組 91
3.7.2 數據合併 92
3.7.3 保存結果 96
3.8 數據清洗案例 97
3.8.1 案例1 97
3.8.2 案例2 102
小結 104
習題3 104
第4章 數據分析 105
4.1 數據定位 105
4.1.1 了解基本數據 105
4.1.2 使用[ ]定位 107
4.1.3 使用loc[ ]定位 108
4.1.4 使用iloc[ ]定位 110
4.1.5 使用iat[ ]定位 112
4.2 條件篩選和排序數據 113
4.2.1 條件篩選 113
4.2.2 排序和排名 117
4.3 數據的描述性分析 121
4.3.1 describe( )方法 121
4.3.2 眾數、均值和中位數 123
4.3.3 數據重塑 124
4.3.4 相關性計算 131
小結 132
習題4 132
第5章 可視化基礎和原則 133
5.1 圖表 135
5.1.1 圖表的種類 135
5.1.2 圖表設計原則 142
5.2 色彩暗示 152
5.2.1 色調 152
5.2.2 明度 153
5.2.3 飽和度 154
5.2.4 色彩暗示的綜合運用 155
5.3 圖表可視化原則 156
5.3.1 “第一眼”原則 156
5.3.2 數據不是敵人 157
5.3.3 刪減無關的元素 157
5.3.4 慎用3D圖表 159
5.3.5 視覺暗示的使用 160
5.3.6 整體變個體 161
5.3.7 互動圖表原則 162
5.3.8 顯示上下文 164
5.4 圖表可視化的失敗案例 165
5.5 設計排版原則 168
5.5.1 順序 168
5.5.2 標註 171
5.5.3 動畫效果 171
5.5.4 分組 173
5.5.5 賦形 173
小結 174
習題5 175
第6章 數據可視化工具 176
6.1 信息圖製作工具 176
6.2 可視化工具Gapminder 179
6.3 可視化工具DataWrapper 181
6.4 可視化工具Gephi 188
6.5 可視化工具QGIS 194
6.6 可視化工具ECharts 201
6.6.1 五分鐘上手ECharts 201
6.6.2 第一個ECharts作品 202
6.6.3 使用ECharts主題 206
6.7 可視化工具Tableau 207
6.7.1 安裝和簡介 208
6.7.2 連線數據 209
6.7.3 工作表 209
6.7.4 儀錶板 210
6.7.5 故事 211
6.7.6 保存和導出 211
6.8 用Python和R實現可視化 215
小結 217
習題6 218
?
第7章 可視化作品發布 219
7.1 網路基礎知識 219
7.2 HTML5基礎 220
7.2.1 HTML文檔 220
7.2.2 HTML常用標籤 221
7.3 CSS3基礎 225
7.3.1 內部CSS 225
7.3.2 外部CSS 228
7.4 JavaScript基礎 229
7.4.1 直接嵌入HTML使用 230
7.4.2 在HTML中調用 230
7.5 Web套用框架和模板 231
7.5.1 Web套用框架 231
7.5.2 Web模板 233
小 結 234
習 題 7 234
附錄A 數據可視化作品 235
附錄B 配套教學資源二維碼 237
參考文獻 238

相關詞條

熱門詞條

聯絡我們