數據分析從入門到進階

《數據分析從入門到進階》是2019年機械工業出版社出版的圖書。

基本介紹

  • 中文名:數據分析從入門到進階
  • 作者:陳紅波 
  • 出版時間:2019年
  • 出版社:機械工業出版社
  • ISBN:9787111628828
內容簡介,圖書目錄,

內容簡介

本書由一線數據分析師精心編寫,通過大量案例介紹了數據分析工作中常用的數據分析方法與工具。本書包括5章內容,分別是數據分析入門、數據分析——從玩轉Excel開始、海量數據管理——拿MySQL說事兒、數據可視化——Tableau的使用、數據分析進階——Python數據分析。本書通俗易懂、通過大量貼近企業真實場景的案例,幫助讀者在提高數據處理技能的同時加深對數據分析思維的理解。
本書適合有志於從事數據分析工作或已從事初級數據分析工作的人士自學,也可作為產品經理、運營人員、市場人員、對數據分析感興趣的企業高管以及創業者的參考用書。

圖書目錄

前言
第1章 數據分析入門1
1.1 什麼是數據分析1
1.1.1 數據分析的含義1
1.1.2 數據分析的操作步驟2
1.1.3 數據分析的套用場景5
1.1.4 數據分析的發展趨勢8
1.2 數據分析的職業發展及分類8
1.3 數據分析之道10
1.3.1 三類統計分析策略10
1.3.2 數據分析的常用方法17
1.4 數據分析之術22
1.4.1 必備的Excel處理方法22
1.4.2 高超的資料庫查詢技巧23
1.4.3 純熟的數據可視化技能23
1.4.4 高大上的統計編程技術26
第2章 數據分析——從玩轉Excel開始28
2.1 Excel概述28
2.1.1 強大的數據處理技能28
2.1.2 實用的數據分析技巧29
2.1.3 豐富的數據可視化圖表30
2.1.4 便捷的自動化數據處理30
2.1.5 快速實現業務報表開發32
2.2 高效處理數據的Excel函式家族34
2.2.1 常用的統計分析函式35
2.2.2 靈活的文本處理函式49
2.2.3 便捷的數值運算函式59
2.2.4 經典的邏輯判斷函式68
2.2.5 實用的日期計算函式74
2.2.6 高效的匹配查找函式80
2.3 十分有用的Excel數據分析技巧94
2.3.1 數據透視表實現統計分析95
2.3.2 描述性統計分析113
2.3.3 相關係數與協方差115
2.3.4 線性回歸模型預測118
2.3.5 移動平均模型預測121
2.4 酷炫的Excel圖表可視化123
2.4.1 Excel基礎圖表123
2.4.2 高級可視化圖表135
2.5 讓你的Excel報表動起來141
2.5.1 VBA基礎語法142
2.5.2 錄製宏,解放你的雙手152
2.5.3 VBA套用:學生成績信息統計154
2.5.4 VBA套用:報表傳送前的一鍵最佳化155
2.5.5 VBA套用:資料庫字典的超連結156
2.5.6 VBA套用:一鍵合併拆分工作簿158
2.5.7 VBA套用:從資料庫獲取並更新數據163
第3章 海量數據管理——拿MySQL說事兒174
3.1 MySQL資料庫的安裝174
3.2 將數據寫入到資料庫中178
3.2.1 常用的數據類型178
3.2.2 手工建表181
3.2.3 數據插入183
3.2.4 外部數據的批量導入186
3.3 重要的單表查詢191
3.3.1 SQL查詢的7個核心關鍵字——以鏈家二手房數據為例192
3.3.2 基於CASE WHEN的常用查詢——以電商交易數據為例201
3.3.3 幾種常見的嵌套查詢——以學員考試成績為例205
3.3.4 基於分組排序的輔助列功能——以銷售員業績數據為例210
3.4 複雜的多表查詢214
3.4.1 縱向表合併——以超市交易數據為例215
3.4.2 表連線操作——以校園一卡通記錄數據為例217
3.5 通過索引提高數據的查詢速度224
3.5.1 常見的索引類型224
3.5.2 索引的查詢和刪除229
3.5.3 關於索引的注意事項230
3.6 資料庫的增刪改操作231
3.6.1 資料庫的增操作231
3.6.2 資料庫的刪操作232
3.6.3 資料庫的改操作235
第4章 數據可視化——Tableau的使用238
4.1 數據可視化概述238
4.1.1 什麼是數據可視化238
4.1.2 為什麼要實現數據可視化240
4.2 Tableau概述241
4.2.1 軟體安裝241
4.2.2 連線數據源243
4.2.3 數據源界面249
4.2.4 工作區界面251
4.2.5 高級操作259
4.2.6 保存結果264
4.3 數據可視化圖表265
4.3.1 條形圖266
4.3.2 柱形圖267
4.3.3 折線圖268
4.3.4 面積圖271
4.3.5 符號圖272
4.3.6 樹狀圖272
4.3.7 氣泡圖273
4.3.8 文字雲273
4.3.9 餅圖274
4.3.10 熱圖274
4.3.11 盒須圖275
4.3.12 雙軸圖276
4.3.13 動態圖表277
4.3.14 參數圖表279
4.3.15 漏斗圖282
4.4 儀錶板的製作與發布286
4.4.1 儀錶板的製作286
4.4.2 可視化成果發布288
第5章 數據分析進階——Python數據分析291
5.1 數據分析的利器——Python291
5.1.1 Anoconda——Python集成開發環境的安裝292
5.1.2 Python編程工具的選擇295
5.2 Jupyter的使用技巧297
5.2.1 代碼運行組合鍵297
5.2.2 代碼框操作組合鍵297
5.2.3 注釋組合鍵297
5.2.4 幫助組合鍵298
5.2.5 代碼與筆記的切換組合鍵298
5.3 數據讀取——從pandas開始299
5.3.1 文本檔案的讀取299
5.3.2 電子表格的讀取301
5.3.3 資料庫數據的讀取303
5.4 常見的數據處理技術306
5.4.1 數據的概覽與清洗306
5.4.2 數據的引用312
5.4.3 多表合併與連線314
5.4.4 數據的匯總319
5.5 探索性數據分析324
5.5.1 異常數據的檢測與處理324
5.5.2 數據的描述331
5.5.3 數據的推斷348
5.6 線性回歸模型的套用358
5.6.1 簡單線性回歸模型——剎車距離的研究359
5.6.2 多元線性回歸模型——產品市場銷售額的研究363
5.6.3 模型的顯著性檢驗——F檢驗365
5.6.4 回歸係數的顯著性檢驗——t檢驗367
5.6.5 基於回歸模型識別異常點370
5.6.6 模型的預測372

相關詞條

熱門詞條

聯絡我們