從零開始學Python數據分析(視頻教學版)

從零開始學Python數據分析(視頻教學版)

《從零開始學Python數據分析(視頻教學版)》一書由機械工業出版社出版發行。

基本介紹

  • 書名:從零開始學Python數據分析(視頻教學版) 
  • 作者:羅攀 
  • 出版社機械工業出版社 
  • 出版時間:2018年
  • 頁數:272 頁
  • 定價:69 元
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787111606468
內容簡介,圖書目錄,本書精華內容,作者簡介,

內容簡介

網路中的信息是很龐大的。如何提取這些信息?如何分析這些信息?這都需要用到數據分析技術。而數據分析技術的首選語言是Python,而本書便是一本適合“小白”學習Python數據分析的入門圖書,書中不僅有各種分析框架的使用技巧,而且也有各類數據圖表的繪製方法。本書通過講解多個案例,讓讀者體驗數據背後的樂趣。
本書共11章,核心內容包括Python數據分析環境安裝、NumPy基礎、pandas基礎、外部數據讀取與存儲、數據清洗與整理、數據分組與聚合、matplotlib可視化、seaborn可視化、pyecharts可視化、時間序列、網站日誌分析綜合案例等。本書適合Python數據分析的初學者和愛好者閱讀,也適合作為各類院校相關專業的教學用書,同時還適合相關社會培訓機構作為Python數據分析的培訓教材或者參考書。

圖書目錄

第1章 Python環境搭建與使用... 1
1.1 Anaconda的安裝和使用.. 1
1.1.1 Anaconda的安裝.. 1
1.1.2 Anaconda的使用.. 3
1.2 Jupyter Notebook的使用.. 5
1.2.1 更改工作空間.. 5
1.2.2 界面介紹與使用.. 7
第2章 NumPy入門和實戰... 9
2.1 ndarray多維數組.. 9
2.1.1 創建ndarray數組.. 9
2.1.2 ndarray對象屬性.. 12
2.1.3 ndarray數據類型.. 13
2.1.4 數組變換.. 15
2.1.5 NumPy的隨機數函式.. 18
2.2 數組的索引和切片.. 20
2.2.1 數組的索引.. 21
2.2.2 數組的切片.. 23
2.2.3 布爾型索引.. 24
2.2.4 花式索引.. 26
2.3 數組的運算.. 26
2.3.1 數組和標量間的運算.. 26
2.3.2 通用函式.. 27
2.3.3 條件邏輯運算.. 28
2.3.4 統計運算.. 30
2.3.5 布爾型數組運算.. 31
2.3.6 排序.. 32
2.3.7 集合運算.. 33
2.3.8 線性代數.. 34
2.4 數組的存取.. 34
2.4.1 數組的存儲.. 35
2.4.2 數組的讀取.. 35
2.5 綜合示例——圖像變換.. 35
第3章 pandas入門和實戰... 38
3.1 pandas數據結構.. 38
3.1.1 創建Series數據.. 38
3.1.2 創建DataFrame數據.. 40
3.1.3 索引對象.. 43
3.2 pandas索引操作.. 44
3.2.1 重新索引.. 45
3.2.2 更換索引.. 46
3.2.3 索引和選取.. 48
3.2.4 操作行和列.. 52
3.3 pandas數據運算.. 53
3.3.1 算術運算.. 54
3.3.2 函式套用和映射.. 55
3.3.3 排序.. 56
3.3.4 匯總與統計.. 57
3.3.5 唯一值和值計數.. 58
3.4 層次化索引.. 59
3.4.1 層次化索引簡介.. 59
3.4.2 重排分級順序.. 60
3.4.3 匯總統計.. 61
3.5 pandas可視化.. 61
3.5.1 線形圖.. 61
3.5.2 柱狀圖.. 63
3.5.3 直方圖和密度圖.. 66
3.5.4 散點圖.. 67
3.6 綜合示例——小費數據集.. 68
3.6.1 數據分析流程.. 68
3.6.2 數據來源.. 68
3.6.3 定義問題.. 69
3.6.4 數據清洗.. 69
3.6.5 數據探索.. 70
第4章 外部數據的讀取與存儲... 73
4.1 文本數據的讀取與存儲.. 73
4.1.1 CSV檔案的讀取.. 73
4.1.2 TXT檔案的讀取.. 80
4.1.3 文本數據的存儲.. 81
4.2 JSON和Excel數據的讀取與存儲.. 82
4.2.1 JSON數據的讀取與存儲.. 82
4.2.2 Excel數據的讀取與存儲.. 85
4.3 資料庫的讀取與存儲.. 87
4.3.1 連線資料庫.. 87
4.3.2 讀取資料庫.. 88
4.3.3 存儲資料庫.. 90
4.4 Web數據的讀取.. 90
4.4.1 讀取HTML表格.. 90
4.4.2 網路爬蟲.. 92
第5章 數據清洗與整理... 95
5.1 數據清洗.. 95
5.1.1 處理缺失值.. 95
5.1.2 移除重複數據.. 99
5.1.3 替換值.. 101
5.1.4 利用函式或映射進行數據轉換.. 101
5.1.5 檢測異常值.. 102
5.1.6 虛擬變數.. 103
5.2 數據合併和重塑.. 104
5.2.1 merge合併.. 105
5.2.2 concat連線.. 110
5.2.3 combine_first合併.. 113
5.2.4 數據重塑.. 114
5.3 字元串處理.. 116
5.3.1 字元串方法.. 117
5.3.2 正則表達式.. 118
5.4 綜合示例——Iris數據集.. 118
5.4.1 數據來源.. 118
5.4.2 定義問題.. 119
5.4.3 數據清洗.. 119
5.4.4 數據探索.. 123
第6章 數據分組與聚合... 125
6.1 數據分組.. 125
6.1.1 GroupBy簡介.. 125
6.1.2 按列名分組.. 128
6.1.3 按列表或元組分組.. 130
6.1.4 按字典分組.. 130
6.1.5 按函式分組.. 131
6.2 聚合運算.. 132
6.2.1 聚合函式.. 132
6.2.2 多函式套用.. 134
6.3 分組運算.. 136
6.3.1 transform方法.. 137
6.3.2 apply方法.. 138
6.4 數據透視表.. 139
6.4.1 透視表.. 140
6.4.2 交叉表.. 140
6.5 綜合實例——巴爾的摩公務員工資數據集.. 142
6.5.1 數據來源.. 142
6.5.2 定義問題.. 143
6.5.3 數據清洗.. 143
6.5.4 數據探索.. 144
第7章 matplotlib可視化... 148
7.1 線形圖.. 148
7.1.1 基本使用.. 148
7.1.2 顏色與線形.. 149
7.1.3 點標記.. 151
7.2 柱狀圖.. 152
7.2.1 基本使用.. 152
7.2.2 刻度與標籤.. 155
7.2.3 圖例.. 156
7.3 其他基本圖表.. 158
7.3.1 散點圖.. 158
7.3.2 直方圖.. 159
7.4 自定義設定.. 159
7.4.1 圖表布局.. 159
7.4.2 文本註解.. 162
7.4.3 樣式與字型.. 163
7.5 綜合示例——星巴克店鋪數據集.. 164
7.5.1 數據來源.. 164
7.5.2 定義問題.. 166
7.5.3 數據清洗.. 166
7.5.4 數據探索.. 168
第8章 seaborn可視化... 172
8.1 樣式與分布圖.. 172
8.1.1 seaborn樣式.. 172
8.1.2 坐標軸移除.. 174
8.1.3 單變數分布圖.. 175
8.1.4 多變數分布圖.. 178
8.2 分類圖.. 181
8.2.1 分類散點圖.. 181
8.2.2 箱線圖與琴形圖.. 183
8.2.3 柱狀圖.. 186
8.3 回歸圖與格線.. 187
8.3.1 回歸圖.. 187
8.3.2 格線.. 190
8.4 綜合示例——鐵達尼號生還者數據.. 191
8.4.1 數據來源.. 191
8.4.2 定義問題.. 192
8.4.3 數據清洗.. 192
8.4.4 數據探索.. 195
第9章 pyecharts可視化... 202
9.1 基礎圖表.. 202
9.1.1 pyecharts安裝.. 202
9.1.2 散點圖.. 203
9.1.3 折線圖.. 204
9.1.4 柱狀圖.. 206
9.2 其他圖表.. 209
9.2.1 餅圖.. 210
9.2.2 箱線圖.. 212
9.3 綜合示例——糗事百科用戶數據.. 213
9.3.1 數據來源.. 214
9.3.2 定義問題.. 214
9.3.3 數據清洗.. 215
9.3.4 數據探索.. 217
第10章 時間序列... 224
10.1 datetime模組.. 224
10.1.1 datetime構造.. 224
10.1.2 數據轉換.. 225
10.2 時間序列基礎.. 228
10.2.1 時間序列構造.. 228
10.2.2 索引與切片.. 229
10.3 日期.. 231
10.3.1 日期範圍.. 231
10.3.2 頻率與移動.. 233
10.4 時期.. 235
10.4.1 時期基礎.. 235
10.4.2 頻率轉換.. 236
10.4.3 時期數據轉換.. 237
10.5 頻率轉換與重採樣.. 238
10.5.1 重採樣.. 238
10.5.2 降採樣.. 239
10.5.3 升採樣.. 240
10.6 綜合示例——腳踏車租賃數據.. 241
10.6.1 數據來源.. 241
10.6.2 定義問題.. 242
10.6.3 數據清洗.. 242
10.6.4 數據探索.. 244
第11章 綜合案例——網站日誌分析... 248
11.1 數據來源.. 248
11.1.1 網站日誌解析.. 248
11.1.2 日誌數據清洗.. 251
11.2 日誌數據分析.. 252
11.2.1 網站流量分析.. 252
11.2.2 狀態碼分析.. 255
11.2.3 IP位址分析.. 258

本書精華內容

Python環境搭建與使用
NumPy入門和實戰
pandas入門和實戰
外部數據的讀取與存儲
數據清洗與整理
數據分組與聚合
matplotlib可視化
seaborn可視化
pyecharts可視化
時間序列

作者簡介

羅攀 知名論壇Python爬蟲專題管理員。擅長Python爬蟲、Python數據分析與挖掘等技術。曾經在CSDN等多個知名部落格網站發表多篇技術文章,深受讀者的喜愛。參與編寫並出版了《從零開始學Python網路爬蟲》一書。目前從事線上Python網路爬蟲的培訓工作。

相關詞條

熱門詞條

聯絡我們