Python數據分析、挖掘與可視化(慕課版第2版)

《Python數據分析、挖掘與可視化(慕課版第2版)》是2024年人民郵電出版社出版的圖書。

基本介紹

  • 中文名:Python數據分析、挖掘與可視化(慕課版第2版)
  • 作者:董付國 
  • 語言:中文
  • 出版時間:2024年1月1日
  • 出版社:人民郵電出版社
  • 頁數:256 頁
  • 字數:464000
  • ISBN:9787115626349
  • 開本:16 開
  • 裝幀:平裝
內容簡介,圖書目錄,

內容簡介

本書注重零基礎讀者實現Python從入門到精通,加強讀者基於數據分析而常用的編程基礎,並通過數據分析、機器學習和可視化的內容,增強了讀者對數據進行分析和挖掘的能力。全書共8章,主要內容包括Python開發環境搭建與編碼規範,數據類型、運算符與內置函式,列表、元組、字典、集合與字元串,選擇結構、循環結構、函式定義與使用,檔案操作,數據分析,機器學習,數據可視化。本書可作為高等院校統計學、數學、經濟學、金融學、管理學等專業相關課程的教材,也可作為從事數據諮詢、研究或分析等人士的參考書。

圖書目錄

第 1章 Python開發環境的搭建與編碼規範 1
1.1 Python開發環境的搭建與使用 1
1.1.1 IDLE 2
1.1.2 Anaconda3 3
1.1.3 安裝擴展庫 4
1.2 Python編碼規範 5
1.3 標準庫、擴展庫對象的
導入與使用 7
1.3.1 import模組名[ as 別名] 7
1.3.2 from模組名import
對象名[ as 別名] 7
1.3.3 from模組名import * 8
本章知識要點 8
本章習題 9
第 2章 數據類型、運算符與內置函式 10
2.1 常用內置數據類型 10
2.1.1 整數、浮點數、複數 11
2.1.2 列表、元組、字典、集合 12
2.1.3 字元串 13
2.2 運算符與表達式 14
2.2.1 算術運算符 15
2.2.2 關係運算符 17
2.2.3 成員測試運算符 18
2.2.4 集合運算符 18
2.2.5 邏輯運算符 18
2.3 常用內置函式 19
2.3.1 類型轉換 21
2.3.2 最大值、最小值 22
2.3.3 元素數量、求和 23
2.3.4 排序、逆序 24
2.3.5 基本輸入/輸出 25
2.3.6 range() 26
2.3.7 zip() 26
2.3.8 map()、reduce()、filter() 27
2.4 綜合套用與例題解析 28
本章知識要點 29
本章習題 30
第3章 列表、元組、字典、集合與
字元串 31
3.1 列表與列表推導式 31
3.1.1 創建列表 31
3.1.2 使用下標訪問列表中的
元素 32
3.1.3 列表常用方法 33
3.1.4 列表推導式 34
3.1.5 切片操作 35
3.2 元組與生成器表達式 36
3.2.1 元組與列表的區別 36
3.2.2 生成器表達式 36
3.2.3 序列解包 37
3.3 字典 37
3.3.1 字典元素的訪問 38
3.3.2 字典元素的修改、
添加與刪除 39
3.4 集合 39
3.4.1 集合概述 39
3.4.2 集合常用方法 40
3.5 字元串常用方法 40
3.5.1 encode() 41
3.5.2 format() 41
3.5.3 index()、rindex()、count() 42
3.5.4 replace()、maketrans()、
translate() 42
3.5.5 ljust()、rjust()、center() 43
3.5.6 split()、rsplit()、join() 43
3.5.7 lower()、upper()、capitalize()、
title()、swapcase() 44
3.5.8 startswith()、endswith() 44
3.5.9 strip()、rstrip()、lstrip() 44
3.6 綜合套用與例題解析 45
本章知識要點 47
本章習題 47
第4章 選擇結構、循環結構、
函式定義與使用 49
4.1 選擇結構 49
4.1.1 條件表達式 49
4.1.2 單分支選擇結構 50
4.1.3 雙分支選擇結構 50
4.1.4 嵌套的分支結構 50
4.2 循環結構 51
4.2.1 for循環 51
4.2.2 while循環 51
4.2.3 break與continue語句 52
4.3 函式定義與使用 52
4.3.1 函式定義基本語法 52
4.3.2 lambda表達式 52
4.3.3 遞歸函式 53
4.3.4 生成器函式 53
4.3.5 位置參數、默認值參數、關鍵
參數、可變長度參數 54
4.3.6 變數作用域 55
4.4 綜合套用與例題解析 56
本章知識要點 57
本章習題 58
第5章 檔案操作 59
5.1 檔案操作基礎 59
5.1.1 內置函式open() 59
5.1.2 檔案對象常用方法 60
5.1.3 上下文管理語句with 61
5.2 JSON檔案操作 61
5.3 CSV檔案操作 62
5.4 Word、Excel、PowerPoint
檔案操作實戰 63
本章知識要點 65
本章習題 65
第6章 numpy數組與矩陣運算 67
6.1 numpy數組及其運算 67
6.1.1 創建數組 67
6.1.2 測試兩個數組的對應元素
是否足夠接近 69
6.1.3 修改數組中的元素值 70
6.1.4 數組與標量的運算 71
6.1.5 數組與數組的運算 71
6.1.6 數組排序 72
6.1.7 數組的內積運算 73
6.1.8 訪問數組中的元素 73
6.1.9 數組對函式運算的支持 74
6.1.10 改變數組形狀 75
6.1.11 數組布爾運算 76
6.1.12 分段函式 77
6.1.13 數組堆疊與合併 78
6.2 矩陣生成與常用操作 79
6.2.1 矩陣生成 79
6.2.2 矩陣轉置 79
6.2.3 查看矩陣特徵 80
6.2.4 矩陣乘法 81
6.2.5 計算相關係數矩陣 81
6.2.6 計算方差、協方差、標準差 82
6.3 計算特徵值與特徵向量 82
6.4 計算逆矩陣 83
6.5 求解線性方程組 84
6.6 計算向量和矩陣的範數 85
6.7 奇異值分解 86
6.8 函式向量化 87
本章知識要點 88
本章習題 88
第7章 pandas數據分析實戰 91
7.1 pandas常用數據類型 91
7.1.1 一維數組與常用操作 92
7.1.2 時間序列與常用操作 96
7.1.3 二維數組DataFrame 99
7.2 DataFrame數據處理與分析實戰 101
7.2.1 讀取Excel檔案中的數據 101
7.2.2 篩選符合特定條件的數據 103
7.2.3 查看數據特徵和統計信息 106
7.2.4 按不同標準對數據排序 108
7.2.5 使用分組與聚合對員工
業績進行匯總 110
7.2.6 處理超市交易數據中的
異常值 114
7.2.7 處理超市交易數據中的
缺失值 115
7.2.8 處理超市交易數據中的
重複值 117
7.2.9 使用數據差分查看員工
業績波動情況 118
7.2.10 使用透視表與交叉表查看
業績匯總數據 119
7.2.11 使用重採樣技術按時間段
查看員工業績 123
7.2.12 多索引相關技術與操作 125
7.2.13 使用標準差與協方差分析
員工業績 127
7.2.14 使用pandas的屬性接口實現
高級功能 130
7.2.15 繪製各員工在不同櫃檯
業績平均值的柱狀圖 132
7.2.16 查看DataFrame的記憶體
占用情況 134
7.2.17 數據拆分與合併 135
本章知識要點 139
本章習題 140
第8章 sklearn機器學習實戰 141
8.1 機器學習基本概念 141
8.2 機器學習庫sklearn簡介 147
8.2.1 擴展庫sklearn常用
模組與對象 147
8.2.2 選擇合適的模型和算法 149
8.3 線性回歸算法的原理與套用 149
8.3.1 線性回歸模型的原理 149
8.3.2 sklearn中線性回歸模型的
簡單套用 150
8.3.3 嶺回歸的基本原理與
sklearn實現 151
8.3.4 套索回歸Lasso的基本
原理與sklearn實現 152
8.3.5 彈性網路ElasticNet的基本
原理與sklearn實現 153
8.3.6 使用線性回歸模型預測
兒童身高 153
8.4 邏輯回歸算法的原理與套用 155
8.4.1 邏輯回歸算法的原理與
sklearn實現 155
8.4.2 使用邏輯回歸算法預測
考試能否及格 157
8.5 樸素貝葉斯算法的原理與套用 158
8.5.1 基本概念 158
8.5.2 樸素貝葉斯算法分類的原理與
sklearn實現 160
8.5.3 使用樸素貝葉斯算法對中文
郵件進行分類 161
8.6 決策樹與隨機森林算法的套用 163
8.6.1 基本概念 163
8.6.2 決策樹算法原理與
sklearn實現 163
8.6.3 隨機森林算法原理與
sklearn實現 166
8.6.4 使用決策樹算法判斷學員的
Python水平 168
8.7 支持向量機算法原理與套用 170
8.7.1 支持向量機算法基本原理與
sklearn實現 170
8.7.2 使用支持向量機對手寫數字
圖像進行分類 172
8.8 KNN算法原理與套用 175
8.8.1 KNN算法的基本原理與
sklearn實現 175
8.8.2 使用KNN算法判斷交通
工具類型 177
8.9 KMeans聚類算法原理與套用 178
8.9.1 KMeans聚類算法的基本原理
與sklearn實現 178
8.9.2 使用KMeans聚類算法壓縮
圖像顏色 181
8.10 分層聚類算法原理與套用 182
8.11 DBSCAN算法原理與套用 184
8.12 使用協同過濾算法進行
電影推薦 187
8.13 關聯規則分析原理與套用 189
8.13.1 關聯規則分析原理與
基本概念 189
8.13.2 使用關聯規則分析
演員關係 190
8.14 數據降維 192
8.15 交叉驗證與格線搜尋 195
8.15.1 使用交叉驗證評估模型
泛化能力 195
8.15.2 使用格線搜尋確定模型
最佳參數 197
本章知識要點 199
本章習題 200
第9章 matplotlib數據可視化實戰 201
9.1 數據可視化庫matplotlib基礎 201
9.2 繪製折線圖實戰 202
9.3 繪製散點圖實戰 205
9.4 繪製柱狀圖實戰 208
9.5 繪製餅狀圖實戰 212
9.6 繪製雷達圖實戰 215
9.7 繪製三維圖形實戰 218
9.8 繪圖區域切分實戰 224
9.9 設定圖例樣式實戰 225
9.10 事件回響與處理實戰 229
9.11 填充圖形 244
9.12 保存繪圖結果 246
本章知識要點 247
本章習題 247
部分習題答案 248
第 1章 Python開發環境的搭建與
編碼規範 248
第 2章 數據類型、運算符與
內置函式 248
第3章 列表、元組、字典、集合與
字元串 249
第4章 選擇結構、循環結構、函式
定義與使用 251
第5章 檔案操作 253
第6章 numpy數組與矩陣運算 254
第7章 pandas數據分析實戰 255
附錄A 運算符、內置函式對常用內置
對象的支持情況表 257
附錄B Python關鍵字清單 258
附錄C 常用標準庫對象速查表 260
附錄D 常用Python擴展庫清單 263
參考文獻 264

相關詞條

熱門詞條

聯絡我們