《對比Excel,輕鬆學習SQL數據分析》電子工業出版社出版,作者是張俊紅。本書採用對比的方法,降低學習門檻,提高學習效率。是數據分析師的SQL實操工具書。
基本介紹
- 書名:對比Excel,輕鬆學習SQL數據分析
- 作者:張俊紅
- 類別:計算機
- 出版社:電子工業出版社
- 出版時間:2020年5月
- 頁數:220 頁
- 定價:59 元
- 開本:16 開
- ISBN:9787121390029
內容簡介,圖書目錄,作者簡介,
內容簡介
《對比Excel,輕鬆學習SQL數據分析》適合零基礎學習 SQL 的人員,包括數據分析師、產品經理、數據運營人員、市場行銷人員、應屆畢業生等所有需要利用SQL 查詢數據的人員。
圖書目錄
入門篇
第1章數據分析基礎介紹 2
1.1 數據分析是什麼 2
1.2 為什麼要進行數據分析 2
1.3 數據分析究竟在分析什麼 5
1.4 數據分析的常規分析流程7
1.5 數據分析工具 9
知識篇
第2章資料庫基礎知識 12
2.1 資料庫的發展及組成 12
2.2 SQL 是什麼 . 13
2.3 SQL 的基本功能 . 14
2.4 SQL 查詢的處理步驟 . 15
2.5 不同資料庫的比較 . 16
第3章資料庫工具準備 17
3.1 認識MySQL 官方網站 17
3.2 MySQL 的下載與安裝 . 19
3.3 DBeaver 的下載與安裝 33
3.4 DBeaver 使用說明 42
3.5 寫下第一行SQL 語句 49
第4章數據源的獲取 50
4.1 外部數據 . 50
4.2 公司現有數據 . 50
4.3 新建數據 . 50
4.4 熟悉數據 . 50
第5章數據的獲取 54
5.1 獲取列 . 54
5.2 獲取想要的行 . 56
5.3 行列同時獲取 . 59
5.4 插入一列固定值 . 60
5.5 JSON 列解析 . 61
5.6 對結果進行排序 . 62
第6章數據預處理 65
6.1 缺失值處理 . 65
6.2 重複值處理 . 68
6.3 數據類型轉換 . 70
6.4 重命名 . 72
第7章數據運算 74
7.1 算術運算 . 74
7.2 比較運算 . 76
7.3 邏輯運算 . 78
7.4 數學運算 . 80
7.4.1 求絕對值 . 80
7.4.2 求最小整數值 . 81
7.4.3 求最大整數值 . 81
7.4.4 隨機數生成 . 81
7.4.5 小數點位數調整 . 83
7.4.6 正負判斷 . 83
7.5 字元串運算 . 84
7.5.1 字元串替換 . 84
7.5.2 字元串合併 . 85
7.5.3 字元串截取 . 86
7.5.4 字元串匹配 . 86
7.5.5 字元串計數 . 87
7.5.6 去除字元串空格 . 88
7.5.7 字元串重複 . 89
7.6 聚合運算 . 89
第8章控制函式 94
8.1 if函式 94
8.2 case when 函式 96
第9章日期和時間函式 99
9.1 獲取當前時刻的數據 . 99
9.1.1 獲取當前時刻的日期和時間 . 99
9.1.2 獲取當前時刻的日期 . 99
9.1.3 獲取當前時刻的時間 . 100
9.1.4 獲取當前時刻所屬的周數 . 101
9.1.5 獲取當前時刻所屬的季度 . 102
9.2 日期和時間格式轉換 . 102
9.3 日期和時間運算 . 104
9.3.1 向後偏移日期和時間 . 104
9.3.2 向前偏移日期和時間 . 105
9.3.3 兩個日期之間做差 . 106
9.3.4 兩個日期之間的比較 . 107
第10章數據分組與數據透視表 108
10.1 group by 的底層原理 108
10.2 對分組後的數據進行聚合運算 . 109
10.3 對聚合後的數據進行條件篩選 111
10.4 group_concat函式 112
10.5 rollup. 113
10.6 數據透視表實現 115
第11章視窗函式 . 117
11.1 什麼是視窗函式 117
11.2 聚合函式+over函式 117
11.3 partition by 子句 . 118
11.4 order by 子句 . 120
11.5 序列函式 . 121
第12章多表連線 127
12.1 表的橫向連線 . 127
12.2 表的縱向連線 . 135
12.3 橫向連線的底層原理 . 135
第13章子查詢 139
13.1 子查詢的概念 . 139
13.2 子查詢的分類 . 139
13.3 with 建立臨時表 . 144
實戰篇
第14章 SQL中的其他話題 . 150
14.1 SQL 查詢的執行順序. 150
14.2 變數設定 . 152
14.3 分區表 . 153
14.4 寬表與窄表 . 154
14.5 全量表,增量表,快照表,拉鍊表,流水錶 . 154
14.6 數據回溯 . 156
14.7 數據倉庫的基本分層 . 157
14.8 SQL 語句的代碼規範157
14.9 如何快速梳理資料庫邏輯 159
14.10 如何快速讀懂別人的代碼 160
14.11 編輯器 161
14.12 創建表 167
第15章SQL 數據分析實戰 170
15.1 查詢每個區域的用戶數 170
15.2 查詢每個區域的男女用戶數 171
15.3 查詢姓張的用戶數 171
15.4 篩選出id3~id5 的用戶 172
15.5 篩選出績效不達標的員工 172
15.6 篩選出姓張的且績效不達標的員工 173
15.7 查詢獲得銷售冠軍超過兩次的人 174
15.8 查詢某部門一年的月銷售額最高漲幅 175
15.9 查詢每個季度績效得分大於70 分的員工 175
15.10 刪除重複值 176
15.11 行列互換 177
15.12 多列比較 178
15.13 對成績進行分組179
15.14 周累計數據獲取 180
15.15 周環比數據獲取 181
15.16 查詢獲獎員工信息 182
15.17 計算用戶留存情況 183
15.18 篩選最受歡迎的課程 185
15.19 篩選出每個年級最受歡迎的三門課程 186
15.20 求累積和 187
15.21 獲取新增用戶數 189
15.22 獲取用戶首次購買時間 190
15.23 同時獲取用戶和訂單數據 191
15.24 隨機抽樣 192
15.25 獲取沉默用戶數 193
15.26 獲取新用戶的訂單數 193
15.27 獲取借款到期名單 194
15.28 獲取即將到期的借款信息 195
15.29 獲取歷史逾期借款信息 196
15.30 綜合實戰 196
第16章 SQL中常見的報錯 198
16.1 DBeaver 相關報錯 198
16.2 MySQL 配置相關報錯 202
16.3 語法相關報錯 206
作者簡介
張俊紅:某網際網路公司高級數據分析師,暢銷書《對比Excel,輕鬆學習Python數據分析》作者。喜歡分享,致力於做一個數據科學路上的終身學習者、實踐者、分享者。公眾號“俊紅的數據分析之路”運營人。