Python大數據分析與可視化

Python大數據分析與可視化

《Python大數據分析與可視化》是2023年清華大學出版社出版的圖書,作者是李輝、倪健。

基本介紹

  • 中文名:Python大數據分析與可視化
  • 作者:李輝、倪健
  • 出版時間:2023年10月1日
  • 出版社:清華大學出版社
  • ISBN:9787302642695 
  • 定價:69.80 元
內容簡介,圖書目錄,

內容簡介

本書全面介紹了使用Python進行數據分析所必需的各項知識,全書共分為14章,包括數據分析與可視化概述、Python編程基礎、NumPy數組計算、Pandas基礎知識、Pandas數據獲取與清洗、Pandas數據形式變化、Pandas數據分析與可視化、Pandas數據處理與分析實戰、Matplotlib庫繪製可視化圖表、圖表輔助元素定製與美化、Seaborn繪製數據分析圖表、時間序列數據處理與分析、文本數據分析、圖像處理與分析等內容。結合了有套用背景的數據分析示例,系統介紹了數據分析與可視化方法,可以幫助讀者逐步掌握運用Python技術解決數據分析問題的能力。

圖書目錄

目錄
第1章數據分析與可視化概述/1
1.1數據分析概念與常用指標1
1.1.1數據分析的概念1
1.1.2數據分析常用指標2
1.1.3數據分析常用方法4
1.2什麼是數據可視化4
1.3數據分析與可視化基本流程5
1.4數據分析與可視化開發環境安裝與包管理6
1.4.1Python做數據分析與可視化的優勢6
1.4.2Anaconda工具的安裝與配置7
1.4.3通過Anaconda管理Python包8
1.5Jupyter Notebook的啟動與使用10
1.5.1Jupyter Notebook的啟動11
1.5.2Jupyter Notebook界面功能11
1.5.3Jupyter Notebook的基本使用13
1.6Jupyter的魔術命令16
1.7常見的數據分析與可視化工具17
小結18
思考與練習18
第2章Python編程基礎/19
2.1Python語法基礎19
2.1.1編寫規範19
2.1.2數據類型20
2.1.3運算符21
2.2列表和元組22
2.2.1列表定義與元素訪問22
2.2.2列表的操作方法23
2.2.3元組定義與元素操作25
2.3字典和集合27
2.3.1字典定義與元素操作272.3.2集合定義與元素操作28
2.4程式控制結構29
2.4.1輸入、輸出與順序控制語句29
2.4.2if選擇語句31
2.4.3循環語句31
2.5函式34
2.5.1函式的定義與調用35
2.5.2函式參數類型36
2.5.3函式參數的作用域38
2.5.4匿名函式38
2.6面向對象39
2.6.1類和對象39
2.6.2類的繼承41
2.7模組與包42
2.7.1模組的導入42
2.7.2模組的創建與使用43
2.7.3第三方庫的安裝44
2.7.4包的創建與使用46
2.8程式的錯誤與異常處理48
2.8.1程式的錯誤與處理48
2.8.2程式的異常與處理49
小結50
思考與練習50
第3章NumPy數組計算/52
3.1NumPy與數組對象52
3.1.1NumPy概述52
3.1.2NumPy數組對象53
3.2創建NumPy數組54
3.2.1利用array函式創建數組54
3.2.2其他方式創建數組55
3.2.3利用隨機數模組生成隨機數組58
3.2.4從已有的數組中創建數組60
3.3數組對象的數據類型63
3.3.1查看數據類型63
3.3.2轉換數據類型64
3.4數組運算65
3.4.1形狀相同的數組間運算65
3.4.2形狀不同的數組間運算66
3.4.3數組與標量間的運算67
3.5數組元素的操作68
3.5.1整數索引和切片的基本使用68
3.5.2花式(數組)索引的基本使用70
3.5.3布爾型索引的基本使用71
3.5.4數組元素的刪除、修改和查詢72
3.6數組的重塑和轉置73
3.6.1數組重塑73
3.6.2數組合併74
3.6.3數組分割75
3.6.4數組轉置75
3.7NumPy通用函式77
3.8NumPy數據處理與統計分析79
3.8.1將條件邏輯轉為數組運算79
3.8.2數組統計運算79
3.8.3數組排序80
3.8.4檢索數組元素82
3.8.5重複數據與去重(唯一化)82
3.9NumPy矩陣的基本操作84
3.9.1矩陣創建84
3.9.2矩陣運算86
3.9.3矩陣轉換88
3.10數組讀/寫88
3.10.1讀/寫二進制檔案88
3.10.2讀/寫文本檔案89
3.10.3讀取CSV檔案89
小結90
思考與練習90
第4章Pandas基礎知識/92
4.1Pandas與數據結構92
4.1.1Pandas概述92
4.1.2Pandas中的數據結構93
4.1.3Series對象與生成93
4.1.4DataFrame對象與生成95
4.1.5Pandas的數據類型99
4.1.6算術運算與數據對齊99
4.2Pandas索引操作100
4.2.1Series對象索引操作101
4.2.2DataFrame對象索引操作103
4.2.3索引對象的不可操作性105
4.2.4設定索引106
4.2.5重命名軸名稱111
4.3數據編輯112
4.3.1增加數據112
4.3.2修改數據115
4.3.3刪除數據118
4.4Pandas中調用函式的方法119
4.4.1map()方法套用119
4.4.2apply()方法套用120
4.4.3applymap()方法套用121
4.4.4pipe()方法套用121
小結122
思考與練習122
第5章Pandas數據獲取與清洗/123
5.1數據獲取操作123
5.1.1讀取文本(CSV和TXT)檔案123
5.1.2讀取Excel檔案126
5.1.3讀取JSON數據檔案128
5.1.4讀取HTML表格數據129
5.1.5讀取MySQL資料庫中數據130
5.2數據清洗133
5.2.1空值和缺失值的處理134
5.2.2重複值的處理139
5.2.3異常值的處理141
5.2.4更改數據類型146
5.3數據格式化149
5.3.1數據設定小數位數149
5.3.2數據設定百分比150
5.3.3數據設定千位分隔設定151
5.4數據保存操作151
5.4.1數據保存為CSV檔案151
5.4.2數據保存為Excel檔案152
5.4.3數據保存為JSON格式檔案152
5.4.4數據保存為HTML檔案154
5.4.5數據保存到MySQL資料庫154
小結155
思考與練習155
第6章Pandas數據形式變化/156
6.1數據集成與合併156
6.1.1數據集成概述156
6.1.2主鍵合併數據158
6.1.3軸向堆疊合併數據159
6.1.4合併重疊數據160
6.1.5根據行索引合併數據163
6.1.6數據追加164
6.2數據變換165
6.2.1數據標準化變換166
6.2.2數據離散化處理168
6.2.3數據泛化處理170
6.2.4啞變數處理類別數據170
6.2.5軸向旋轉173
6.3層次化索引與數據重塑175
6.3.1層次化索引的創建175
6.3.2層次化索引的數據訪問與操作180
6.3.3重塑層次化索引183
6.4數據分組與聚合187
6.4.1分組與聚合的原理187
6.4.2數據分組188
6.4.3數據聚合192
小結196
思考與練習196
第7章Pandas數據分析與可視化/197
7.1數據基本統計分析197
7.1.1了解數據信息197
7.1.2統計描述199
7.1.3統計計算200
7.1.4位置計算207
7.2數據選取與查詢209
7.2.1選取指定列的數據210
7.2.2選取一行數據212
7.2.3選取多行數據212
7.2.4選取指定行列數據214
7.2.5剔除區間以外的數據215
7.2.6其他複雜查詢選取數據215
7.3數據排序與排名218
7.3.1按索引排序218
7.3.2按值排序219
7.3.3數據排名221
7.4常用的數據分析223
7.4.1分組分析223
7.4.2分布分析225
7.4.3交叉分析229
7.4.4結構分析230
7.4.5相關分析231
7.5Pandas可視化方法232
小結233
思考與練習234
第8章Pandas數據處理與分析實戰/235
8.1數據集準備235
8.2編程實現數據處理分析235
8.2.1數據探索235
8.2.2處理數據236
8.3Pandas實現成績數據處理與分析237
8.3.1數據探索237
8.3.2數據預處理239
8.3.3數據選取241
8.3.4數據分析243
8.3.5數據可視化244
8.3.6數據輸出245
小結245
思考與練習245
第9章Matplotlib庫繪製可視化圖表/246
9.1數據可視化概述246
9.1.1常見的可視化圖表類型246
9.1.2可視化圖表的基本構成249
9.1.3數據可視化方式選擇依據250
9.1.4常見的數據可視化庫252
9.2可視化Matplotlib庫的概述253
9.2.1Matplotlib庫的使用導入與設定253
9.2.2Matplotlib庫繪圖的層次結構253
9.3Matplotlib庫繪圖的基本流程254
9.3.1創建簡單圖表的基本流程254
9.3.2繪製子圖的基本流程256
9.4使用Matplotlib庫繪製常用圖表262
9.4.1繪製直方圖262
9.4.2繪製散點圖263
9.4.3繪製柱狀圖264
9.4.4繪製折線圖265
9.4.5繪製餅圖266
9.4.6繪製面積圖270
9.4.7繪製熱力圖271
9.4.8繪製箱形圖272
9.4.9繪製雷達圖275
9.4.10繪製3D圖形276
小結278
思考與練習278
第10章圖表輔助元素定製與美化/279
10.1圖表輔助元素的設定279
10.2圖表樣式定製279
10.2.1默認圖表樣式279
10.2.2顏色樣式定製281
10.2.3線型樣式選擇282
10.2.4數據標記添加283
10.2.5字型樣式設定284
10.3設定坐標軸的標籤、刻度範圍和刻度標籤286
10.3.1設定坐標軸的標籤286
10.3.2設定刻度範圍和刻度標籤287
10.4標題和圖例添加與格線線顯示288
10.4.1添加圖表標題288
10.4.2添加圖表圖例289
10.4.3顯示格線線290
10.5添加參考線和參考區域290
10.5.1顯示格線線290
10.5.2添加參考區域291
10.6添加注釋文本與表格291
10.6.1添加指向型注釋文本291
10.6.2添加無指向型注釋文本292
10.6.3在圖表中添加表格293
小結294
思考與練習295
第11章Seaborn繪製數據分析圖表/296
11.1Seaborn與數據集載入296
11.1.1Seaborn概述296
11.1.2Seaborn數據集載入297
11.2Seaborn圖表的基本設定298
11.2.1背景風格設定298
11.2.2設定繪圖元素比例298
11.2.3框線控制299
11.3常用圖表的繪製300
11.3.1可視化數據的分布300
11.3.2對分類數據繪圖305
11.3.3類別內的統計估計307
小結310
思考與練習311
第12章時間序列數據處理與分析/312
12.1日期和時間數據類型312
12.1.1datetime構造312
12.1.2數據轉換314
12.2時間序列的基本操作315
12.2.1創建時間序列315
12.2.2通過時間戳索引選取子集317
12.3固定頻率的時間序列319
12.3.1創建固定頻率的時間序列319
12.3.2時間序列的頻率、偏移量321
12.3.3時間序列的移動323
12.4時間周期及計算324
12.4.1時期對象創建與運算324
12.4.2時期的頻率轉換326
12.5重採樣處理326
12.5.1重採樣方法(resample)327
12.5.2降採樣328
12.5.3升採樣328
12.6視窗計算處理330
12.7基於四類影響要素的時間序列分析332
小結334
思考與練習335
第13章文本數據分析/336
13.1文本數據處理與分析工具336
13.1.1文本數據處理336
13.1.2語料庫中的NLTK與jieba338
13.1.3安裝NLTK和下載語料庫339
13.1.4jieba庫的安裝341
13.2文本預處理341
13.2.1預處理的流程342
13.2.2分詞343
13.2.3詞性標註345
13.2.4詞形歸一化346
13.2.5刪除停用詞348
13.3文本情感分析349
小結352
思考與練習352
第14章圖像處理與分析/353
14.1OpenCV概述353
14.2cv2圖像處理基礎353
14.2.1cv2的基本方法與屬性353
14.2.2圖像處理中的閾值355
14.2.3cv2圖像處理中的幾何變換357
14.3圖像的降噪處理362
14.3.1均值濾波器圖像降噪362
14.3.2中值濾波器圖像降噪363
14.3.3高斯濾波器圖像降噪364
14.3.4雙邊濾波器圖像降噪366
14.4圖像中的圖形檢測367
14.4.1圖像的輪廓367
14.4.2圖像處理中的邊緣檢測369
14.5圖像的分割370
14.5.1常用的圖像分割方法370
14.5.2基於Kmeans的圖像分割371
14.5.3基於區域生長的圖像分割373
14.5.4基於分水嶺算法的圖像分割374
小結376
思考與練習377

相關詞條

熱門詞條

聯絡我們