《智慧型分析:ChatGPT+Excel+Python超強組合玩轉數據分析》是電子工業出版社出版圖書,作者童大謙。
基本介紹
- 中文名:智慧型分析:ChatGPT+Excel+Python超強組合玩轉數據分析
- 作者:童大謙
- 出版時間:2023年12月
- 出版社:電子工業出版社
- 頁數:296 頁
- ISBN:9787121466205
- 定價:89 元
- 開本:16 開
內容簡介,圖書目錄,作者簡介,
內容簡介
寫作本書的目的是希望讓不懂編程的讀者也能使用ChatGPT生成代碼,輕鬆實現Excel數據處理自動化,讓讀者從零基礎成為高手;讓懂編程的讀者也能收穫良多,快速提升工作效率。
書中用ChatGPT自動生成代碼,實現了Excel數據處理自動化的絕大部分內容,包括數據導入和導出、數據整理、數據預處理、數據統計分析、數據可視化和與Excel工作表互動等。書中針對數據處理的每個問題都提供了示例,結合示例實踐了提示詞的編寫技巧,並對與表達、數據、輸出、效率和語言等相關的主題進行了探討和總結。書中的代碼是使用pandas、xlwings和OpenPyXL編寫的,這也是目前通過編程方式處理Excel數據最優的工具組合。
本書適合任何對ChatGPT和Excel數據處理感興趣的讀者閱讀,包括職場辦公人員、數據分析人員、大學生、科研人員和程式設計師等。
圖書目錄
第1章 概述 1
1.1 Excel和Python數據處理簡介 1
1.1.1 Excel數據處理 1
1.1.2 使用Python處理數據 2
1.1.3 pandas、xlwings和OpenPyXL組合的優勢 2
1.1.4 DataFrame和Series 3
1.1.5 Python及各種包的安裝 4
1.1.6 Python IDLE編程環境 5
1.2 ChatGPT及其操作基礎 7
1.2.1 ChatGPT簡介 7
1.2.2 得到想要的答案:提示詞簡介 7
1.2.3 使用ChatGPT生成代碼 9
1.2.4 面向問題重構與提示詞模板 11
1.2.5 使用ChatGPT進行數據分析的主要思想和步驟小結 11
1.3 提示詞的編寫技巧 12
1.3.1 基本技巧 12
1.3.2 數據相關 12
1.3.3 表達相關 13
1.3.4 輸出相關 14
1.3.5 效率相關 14
1.3.6 語言相關 15
1.4 怎樣使用本書 16
1.4.1 不同讀者怎樣使用本書 16
1.4.2 在使用提示詞時可能遇到的問題及解決辦法 16
第2章 使用ChatGPT+pandas實現數據導入和導出 18
2.1 使用ChatGPT+pandas導入Excel檔案中的數據 18
2.1.1 導入Excel檔案中的全部數據 18
2.1.2 導入Excel檔案中的部分數據 20
2.2 使用ChatGPT+pandas將數據寫入Excel檔案中 21
2.3 使用ChatGPT+pandas實現CSV檔案中數據的導入和導出 23
2.4 將數據保存到新工作簿的工作表中 25
2.5 將數據保存到同一工作簿的新工作表中 27
2.6 局部區域數據的導入和導出(與xlwings互動) 31
2.7 局部區域數據的導入和導出(與OpenPyXL互動) 33
第3章 使用ChatGPT+pandas實現單個檔案數據的整理 36
3.1 使用ChatGPT+pandas實現列操作 36
3.1.1 直接添加一個新列 36
3.1.2 利用已有列數據通過簡單計算得到新列 38
3.1.3 利用已有列數據通過轉換得到新列 39
3.1.4 利用已有列數據通過統計得到新列 42
3.1.5 根據簡單條件得到新列 45
3.1.6 根據多級條件得到新列 46
3.1.7 根據多列數據組成的條件得到新列 48
3.1.8 根據條件得到新列(mask方法) 50
3.1.9 根據條件得到新列(where方法) 51
3.1.10 插入列 53
3.1.11 修改單個列的列名 54
3.1.12 修改多個列的列名 56
3.1.13 給所有列名添加前綴和後綴 57
3.1.14 修改列數據的數據類型 59
3.1.15 修改列數據 61
3.1.16 修改列數據的格式 63
3.1.17 將列中的字元串數據修改為數字 65
3.1.18 根據條件修改數據 67
3.1.19 刪除列 68
3.2 使用ChatGPT+pandas實現行操作 70
3.2.1 直接添加一個新行 70
3.2.2 利用已有行數據通過計算得到新行 72
3.2.3 插入行 74
3.2.4 修改行名 76
3.2.5 修改行數據 78
3.2.6 刪除行 79
3.3 使用ChatGPT+pandas實現值操作 81
3.3.1 修改單個值 81
3.3.2 修改局部區域中的值 82
3.3.3 修改所有值 84
3.4 使用ChatGPT+pandas實現數據查詢 86
3.4.1 單條件查詢 86
3.4.2 多條件查詢 88
3.5 使用ChatGPT+pandas實現數據排序 89
3.5.1 單條件排序 89
3.5.2 多條件排序 91
3.5.3 提取前3名數據 92
3.6 使用ChatGPT+pandas實現數據篩選 94
3.6.1 單條件篩選 94
3.6.2 多條件篩選 96
3.7 使用ChatGPT+pandas實現數據排名 97
3.7.1 中國式排名 97
3.7.2 美國式排名 99
第4章 使用ChatGPT+pandas實現多個檔案數據的整理 102
4.1 使用ChatGPT+pandas拆分數據 102
4.1.1 簡單拆分——垂直 102
4.1.2 簡單拆分——水平 104
4.1.3 根據變數的值將數據拆分到不同工作簿中 105
4.2 使用ChatGPT+pandas合併數據 107
4.2.1 合併不同工作表中的數據 107
4.2.2 合併不同工作簿中的數據 112
4.3 使用ChatGPT+pandas拼接數據 114
4.4 使用ChatGPT+pandas連線數據 116
4.5 使用ChatGPT+pandas追加數據 118
第5章 使用ChatGPT+pandas實現文本數據的整理 120
5.1 使用ChatGPT+pandas提取子文本 120
5.2 使用ChatGPT+pandas改變文本大小寫 122
5.3 使用ChatGPT+pandas實現分列 124
5.3.1 使用單一分隔設定進行分列 124
5.3.2 使用多種分隔設定進行分列 126
5.3.3 按照固定寬度進行分列 128
5.4 使用ChatGPT+pandas合併文本 129
5.5 使用ChatGPT+pandas查找和替換子文本 132
5.6 使用ChatGPT+pandas輸出文本的格式 133
第6章 使用ChatGPT+pandas實現日期時間數據的整理 136
6.1 使用ChatGPT+pandas實現時間點數據的整理 136
6.1.1 從給定的日期時間中提取單位對應的數字 136
6.1.2 計算給定日期是星期幾 138
6.2 使用ChatGPT+pandas實現時間段數據的整理 140
6.2.1 計算兩個日期之間的間隔天數 140
6.2.2 已知起始日期和間隔天數計算終止日期 142
第7章 使用ChatGPT+pandas實現時間序列數據的整理 144
7.1 時間序列數據 144
7.1.1 創建時間序列數據 144
7.1.2 從檔案中導入時間序列數據 146
7.2 使用ChatGPT+pandas實現時間序列數據的常見處理 148
7.2.1 數據查詢 148
7.2.2 數據篩選 149
7.2.3 數據轉換 150
7.2.4 數據匯總 152
7.3 使用ChatGPT+pandas實現時間序列數據偏移 153
7.3.1 日期時間偏移 153
7.3.2 工作日偏移 154
7.4 使用ChatGPT+pandas實現時間序列數據平滑 156
7.5 使用ChatGPT+pandas實現時間序列數據重採樣 158
第8章 使用ChatGPT+pandas實現分類數據的整理 160
8.1 分類數據 160
8.1.1 創建分類數據 160
8.1.2 設定分類值 162
8.1.3 對分類數據進行排序 163
8.2 使用ChatGPT+pandas處理分類數據 164
8.2.1 查詢分類 165
8.2.2 增加分類值 166
8.2.3 修改分類值 167
8.2.4 刪除分類值 168
第9章 使用ChatGPT+pandas實現數據預處理 170
9.1 使用ChatGPT+pandas處理重複數據 170
9.1.1 整行數據重複的處理 170
9.1.2 指定數據重複的處理 172
9.2 使用ChatGPT+pandas處理缺失值 173
9.2.1 發現缺失值 174
9.2.2 刪除缺失值 176
9.2.3 填充缺失值 177
9.3 使用ChatGPT+pandas處理異常值 179
9.3.1 發現異常值 179
9.3.2 刪除異常值 182
9.3.3 替換異常值 184
9.4 使用ChatGPT+pandas實現數據轉換 185
9.4.1 數據標準化 186
9.4.2 數據歸一化 187
第10章 使用ChatGPT+pandas實現統計分析 190
10.1 使用ChatGPT+pandas實現描述性統計 190
10.1.1 描述數據集中趨勢 190
10.1.2 描述數據離中趨勢 192
10.1.3 描述數據分布形狀 194
10.2 使用ChatGPT+pandas實現分組統計 195
10.2.1 分組描述性統計 195
10.2.2 分組提取首次數據和末次數據 197
10.2.3 多條件匯總 199
10.2.4 分組按條件統計 201
10.3 使用ChatGPT+pandas實現頻數分析 202
10.4 使用ChatGPT+pandas實現數據透視表 204
10.4.1 創建數據透視表 204
10.4.2 設定數據透視表中值的輸出格式 206
10.4.3 處理數據透視表中的缺失值 208
10.4.4 設定數據透視表的聚合函式 210
10.4.5 為數據透視表添加行匯總和列匯總 213
10.4.6 設定數據透視表中數據的顯示方式 215
10.4.7 對數據透視表中的數據進行排序 217
10.4.8 聚合函式為連線字元串 219
第11章 使用ChatGPT實現與Excel工作表相關的設定 223
11.1 使用ChatGPT+xlwings設定Excel工作表 223
11.1.1 設定框線 223
11.1.2 設定背景色 227
11.1.3 設定字型 229
11.1.4 設定對齊方式 231
11.1.5 單元格合併和取消合併 233
11.2 使用ChatGPT+OpenPyXL設定Excel工作表 235
11.2.1 設定框線 235
11.2.2 設定背景色 238
11.2.3 設定字型 239
11.2.4 設定對齊方式 241
11.2.5 單元格合併和取消合併 242
第12章 使用ChatGPT實現數據可視化 244
12.1 使用ChatGPT+xlwings實現數據可視化 244
12.1.1 條形圖 244
12.1.2 餅圖 247
12.2 使用ChatGPT+OpenPyXL實現數據可 視化 249
12.2.1 條形圖 249
12.2.2 餅圖 251
12.3 使用ChatGPT+Matplotlib實現數據可視化 252
12.3.1 條形圖 253
12.3.2 餅圖 254
第13章 Python語法基礎 256
13.1 常量和變數 256
13.1.1 常量 256
13.1.2 變數及其聲明、賦值和刪除 256
13.1.3 變數的數據類型 257
13.2 數字 257
13.2.1 整型數字 257
13.2.2 浮點型數字 258
13.3 字元串 258
13.3.1 創建字元串 258
13.3.2 索引和切片 258
13.3.3 字元串的長度和大小寫 259
13.3.4 字元串的分割、連線和刪除 259
13.4 列表 260
13.4.1 創建列表 260
13.4.2 添加列表元素 261
13.4.3 索引和切片 261
13.4.4 刪除列表元素 262
13.5 元組 262
13.5.1 元組的創建和刪除 263
13.5.2 索引和切片 263
13.6 字典 263
13.6.1 字典的創建 263
13.6.2 字典元素的增、刪、改、查 264
13.7 表達式 265
13.7.1 算術運算符 265
13.7.2 關係運算符 265
13.7.3 邏輯運算符 266
13.8 流程控制 266
13.8.1 判斷結構 266
13.8.2 循環結構——for循環 268
13.8.3 循環結構——while循環 268
13.9 函式 269
13.9.1 內部函式 269
13.9.2 標準模組函式和第三方模組 函式 269
13.9.3 自定義函式 269
第14章 pandas基礎 271
14.1 NumPy數組 271
14.1.1 創建NumPy數組 271
14.1.2 索引和切片 274
14.2 Series 275
14.2.1 創建Series對象 275
14.2.2 Series對象的描述 276
14.2.3 索引和切片 277
14.2.4 布爾索引 279
作者簡介
童大謙,具有15年以上VB、VBA、.NET開發經驗,開發了多個數學、數據分析與可視化方面的軟體,以及與科研院所合作開發了若干個軟體系統。對Python、MATLAB、SPSS、R等數據分析軟體非常熟悉,出版多本相關圖書。曾在高校執教,CSDN高級講師,全網學員目前近30萬人。