python數據分析與可視化(2021年人民郵電出版社出版的圖書)

python數據分析與可視化(2021年人民郵電出版社出版的圖書)

本詞條是多義詞,共4個義項
更多義項 ▼ 收起列表 ▲

《python數據分析與可視化》是2021年人民郵電出版社出版的圖書。本書採用理論分析和Python編程實戰相結合的形式,按照數據分析與可視化的基本步驟,數據分析與可視化的基本理論知識和相應的Python庫進行了詳細的介紹,讓讀者能夠在了解基本理論知識的同時快速上手實現數據分析與可視化的程式。

基本介紹

  • 中文名:python數據分析與可視化
  • 作者:呂雲翔、李伊琳
  • 出版社:人民郵電出版社
  • ISBN:9787115544346
內容簡介,圖書目錄,作者簡介,

內容簡介

使用Python進行數據分析與可視化是十分便利且高效的,因此Python被認為是優秀的數據分析工具之一。本書從理論和實戰兩個角度對數據分析與可視化和Python工具進行了介紹。本書採用理論分析和Python編程實戰相結合的形式,按照數據分析與可視化的基本步驟,數據分析與可視化的基本理論知識和相應的Python庫進行了詳細的介紹,讓讀者能夠在了解基本理論知識的同時快速上手實現數據分析與可視化的程式。
本書適合Python初學者、數據分析從業人員以及高等院校計算機科學、軟體工程、大數據、人工智慧等相關專業的師生閱讀。

圖書目錄

第1章 數據分析是什麼 1
1.1 數據分析與數據挖掘的關係 1
1.2 機器學習與數據分析的關係 1
1.3 數據分析的基本步驟 2
1.4 Python和數據分析 2
1.5 本章小結 3
第2章 Python——從了解Python開始 4
2.1 Python及pandas、scikit-learn、Matplotlib的安裝 4
2.1.1 Windows作業系統下Python的安裝 4
2.1.2 macOS下Python的安裝 5
2.1.3 pandas、scikit-learn和Matplotlib的安裝 5
2.1.4 使用科學計算發行版Python進行快速安裝 5
2.2 Python基礎知識 6
2.2.1 縮進 6
2.2.2 模組化的系統 7
2.2.3 注釋 7
2.2.4 語法 7
2.3 重要的Python庫 7
2.3.1 pandas 7
2.3.2 scikit-learn 8
2.3.3 Matplotlib 8
2.3.4 其他 8
2.4 Jupyter 9
2.5 本章小結 9
第3章 數據預處理——不了解數據,一切都是空談 10
3.1 了解數據 10
3.2 數據質量 12
3.2.1 完整性 12
3.2.2 一致性 13
3.2.3 準確性 14
3.2.4 及時性 14
3.3 數據清洗 14
3.4 特徵工程 16
3.4.1 特徵選擇 16
3.4.2 特徵構建 16
3.4.3 特徵提取 17
3.5 本章小結 17
第4章 NumPy——數據分析基礎工具 18
4.1 多維數組對象:ndarray對象 18
4.1.1 ndarray對象的創建 19
4.1.2 ndarray對象的數據類型 21
4.2 ndarray對象的索引、切片和疊代 21
4.3 ndarray對象的shape操作 23
4.4 ndarray對象的基礎操作 23
4.5 本章小結 25
第5章 pandas——處理結構化數據 26
5.1 基本數據結構 26
5.1.1 Series 26
5.1.2 DataFrame 28
5.2 基於pandas的Index對象的訪問操作 32
5.2.1 pandas的Index對象 33
5.2.2 索引的不同訪問方式 35
5.3 數學統計和計算工具 38
5.3.1 統計函式:協方差、相關係數、排序 38
5.3.2 視窗函式 40
5.4 數學聚合和分組運算 45
5.4.1 agg函式的聚合操作 47
5.4.2 transform函式的轉換操作 48
5.4.3 apply函式的一般操作 49
5.5 本章小結 49
第6章 數據分析與知識發現——一些常用的方法 50
6.1 分類分析 50
6.1.1 邏輯回歸 51
6.1.2 線性判別分析 51
6.1.3 支持向量機 51
6.1.4 決策樹 52
6.1.5 k近鄰 53
6.1.6 樸素貝葉斯 54
6.2 關聯分析 54
6.2.1 基本概念 54
6.2.2 經典算法 55
6.3 聚類分析 60
6.3.1 k均值算法 60
6.3.2 DBSCAN 61
6.4 回歸分析 62
6.4.1 線性回歸分析 63
6.4.2 支持向量回歸 63
6.4.3 k近鄰回歸 63
6.5 本章小結 64
第7章 scikit-learn——實現數據的分析 65
7.1 分類方法 65
7.1.1 邏輯回歸 65
7.1.2 支持向量機 66
7.1.3 近鄰 67
7.1.4 決策樹 68
7.1.5 隨機梯度下降 68
7.1.6 高斯過程分類 69
7.1.7 多層感知器 69
7.1.8 樸素貝葉斯 70
7.2 回歸方法 71
7.2.1 小二乘法 71
7.2.2 嶺回歸 71
7.2.3 Lasso回歸 72
7.2.4 貝葉斯嶺回歸 72
7.2.5 決策樹回歸 73
7.2.6 高斯過程回歸 73
7.2.7 近鄰回歸 74
7.3 聚類方法 75
7.3.1 k均值 75
7.3.2 相似性傳播 76
7.3.3 均值漂移 76
7.3.4 譜聚類 77
7.3.5 層次聚類 77
7.3.6 DBSCAN 78
7.3.7 BIRCH 79
7.4 本章小結 80
第8章 Matplotlib——互動式圖表繪製 81
8.1 基本布局對象 81
8.2 圖表樣式的修改以及圖表裝飾項接口 84
8.3 基礎圖表繪製 88
8.3.1 直方圖 88
8.3.2 散點圖 89
8.3.3 餅圖 91
8.3.4 柱狀圖 92
8.3.5 折線圖 95
8.3.6 表格 96
8.3.7 不同坐標系下的圖像 97
8.4 matplot3D 98
8.5 Matplotlib與Jupyter結合 99
8.6 本章小結 101
第9章 實戰:影評數據分析與電影推薦 102
9.1 明確目標與數據準備 102
9.1.1 明確目標 102
9.1.2 數據採集與處理 102
9.1.3 工具選擇 103
9.2 初步分析 104
9.2.1 用戶角度分析 104
9.2.2 電影角度分析 107
9.3 電影推薦 110
9.4 本章小結 111
第10章 實戰:汽車貸款違約的數據分析 112
10.1 數據分析常用的Python庫 112
10.2 數據樣本分析 113
10.2.1 初步分析樣本的所有變數 113
10.2.2 變數類型分析 114
10.2.3 Python代碼實踐 115
10.3 數據分析的預處理 116
10.3.1 目標變數探索 116
10.3.2 X變數初步探索 117
10.3.3 連續變數的缺失值處理 118
10.3.4 分類變數的缺失值處理 120
10.4 數據分析的模型建立與模型評估 122
10.4.1 數據預處理與訓練集劃分 122
10.4.2 採用回歸模型進行數據分析 123
10.4.3 採用決策樹模型進行數據分析 125
10.4.4 採用隨機森林模型最佳化決策樹模型 127
10.5 本章小結 128
第11章 實戰:Python表格數據分析 129
11.1 背景介紹 129
11.2 前期準備與基本操作 130
11.2.1 基本術語概念說明 130
11.2.2 安裝openpyxl並創建一個工作簿 130
11.2.3 從Excel工作簿中讀取數據 131
11.2.4 疊代訪問數據 133
11.2.5 修改與插入數據 135
11.3 進階內容 137
11.3.1 為Excel工作簿添加公式 137
11.3.2 為Excel工作簿添加條件格式 139
11.3.3 為Excel工作簿添加圖表 142
11.4 數據分析實例 145
11.4.1 背景與前期準備 145
11.4.2 使用openpyxl讀取數據並將其轉化為Dataframe對象 145
11.4.3 繪製數值列直方圖 146
11.4.4 繪製相關性矩陣 147
11.4.5 繪製散布矩陣 149
11.4.6 將可視化結果插入Excel工作簿中 150
11.5 本章小結 151
第12章 實戰:利用手機的購物評論分析手機特徵 152
12.1 項目介紹 152
12.2 從Kaggle上下載數據 152
12.3 篩選想要的數據 156
12.4 分析數據 159
12.4.1 算法介紹 159
12.4.2 算法套用 160
12.5 本章小結 171
第13章 實戰:基於k近鄰模型預測葡萄酒種類的數據分析與可視化 172
13.1 機器學習的模型和數據 172
13.2 k近鄰模型的介紹與初步建立 173
13.2.1 k近鄰模型的初步建立 173
13.2.2 使用專業庫建立k近鄰模型 178
13.2.3 使用scikit-learn 182
13.3 數據可視化 183
13.4 本章小結 185
第14章 實戰:美國波士頓房價預測 186
14.1 數據清洗 187
14.2 數據分析 195
14.3 分析結果 199
14.4 本章小結 199

作者簡介

比利時布魯塞爾大學套用科學學院套用信息技術專業碩士、經濟學院工商管理專業碩士。具有多年的軟體開發、項目管理、計算機教學經驗。對IT行業具有較全面的認識。2003至今任北航軟體學院副教授。研究領域包括:軟體工程 IT項目管理。

相關詞條

熱門詞條

聯絡我們