《Python數據分析第2版》是2018年人民郵電出版社出版的書籍,作者是[美]阿曼多·凡丹戈。
基本介紹
- 中文名:Python數據分析第2版
- 作者:[美]阿曼多·凡丹戈
- 出版時間:2018年6月1日
- 出版社:人民郵電出版社
- 頁數:274 頁
- ISBN:9787115481177
- 定價:69 元
- 開本:16 開
- 裝幀: 平裝
內容簡介,目錄,
內容簡介
全書共12章,從Python程式庫入門、NumPy數組和Pandas入門開始,陸續介紹了數據的檢索、數據加工與存儲、數據可視化等內容。同時,本書還介紹了信號處理與時間序列、套用資料庫、分析文本數據與社交媒體、預測性分析與機器學習、Python生態系統的外部環境和雲計算、性能最佳化及分析、並發性等內容。在本書的最後,還採用3個附錄的形式為讀者補充了一些重要概念、常用函式以及線上資源等重要內容。
目錄
第 1章 Python程式庫入門 1
1.1 安裝Python 3 3
1.1.1 安裝數據分析程式庫 3
1.1.2 Linux平台或Mac OS X平台 3
1.1.3 Windows平台 4
1.2 將IPython用作shell 4
1.3 學習手冊頁 6
1.4 Jupyter Notebook 7
1.5 NumPy數組 8
1.6 一個簡單的套用 8
1.7 從何處尋求幫助和參考資料 11
1.8 查看Python庫中包含的模組 12
1.9 通過Matplotlib實現數據的可視化 12
1.10 小結 14
第 2章 NumPy數組 15
2.1 NumPy數組對象 16
2.2 創建多維數組 17
2.3 選擇NumPy數組元素 17
2.4 NumPy的數值類型 18
2.4.1 數據類型對象 20
2.4.2 字元碼 20
2.4.3 dtype構造函式 21
2.4.4 dtype屬性 22
2.5 一維數組的切片與索多和寒汗引 23
2.6 處理數組形狀 23
2.6.1 堆疊數組 25
2.6.2 拆分NumPy數組 28
2.6.3 NumPy數組的屬性匙囑祖 30
2.6.4 數組的轉換 34
2.7 創建數組的視圖和拷貝 35
2.8 花式索引 36
2.9 基於位置列表的索引方法 38
2.10 用布爾型變數索引NumPy數組 39
2.11 NumPy數組的廣播 41
2.12 小結 44
2.13 參考資料 44
第3章 Pandas入門 45
3.1 Pandas的安裝與概覽 46
3.2 Pandas數據結構之DataFrame 47
3.3 Pandas數據結構之Series 49
3.陵主炒4 利用Pandas查詢數據 52
3.5 利用Pandas的DataFrame進行統計計算 56
3.6 利用Pandas的DataFrame實現
數據聚合 58
3.7 DataFrame的串聯與附加
操作 62
3.8 連線DataFrames 63
3.9 處理缺失數據堡故問題 65
3.10 處理日期數據 67
3.11 數據透視表 70
3.12 小結 71
3.13 參考資料 71
第4章 統計學與線性代數 72
4.1 用NumPy進行簡單的描述性統計計算 72
4.2 用NumPy進行線性代永尋抹數運算 75
4.2.1 用NumPy求矩陣的逆 75
4.2.2 用NumPy解線性方程組 77
4.3 用NumPy計算特徵值和特徵向量 享敬踏78
4.4 NumPy隨機數 晚兵道漿80
4.4.1 用二項式分布進行博弈 81
4.4.2 常態分配採樣 83
4.4.3 用SciPy進行正態檢驗 84
4.5 創建掩碼式NumPy數組 86
4.6 忽略負值和極值 88
4.7 小結 91
第5章 數據的檢索、加工與存儲 92
5.1 利用NumPy和pandas對CSV檔案進行寫操作 92
5.2 二進制.npy與pickle格式 94
5.3 使用PyTables存儲數據 97
5.4 Pandas DataFrame與HDF5倉庫之間的讀寫操作 99
5.5 使用Pandas讀寫Excel檔案 102
5.6 使用REST Web服務和JSON 103
5.7 使用Pandas讀寫JSON 105
5.8 解析RSS和Atom訂閱 106
5.9 使用Beautiful Soup解析HTML 108
5.10 小結 114
5.11 參考資料 114
操作 62
3.8 連線DataFrames 63
3.9 處理缺失數據問題 65
3.10 處理日期數據 67
3.11 數據透視表 70
3.12 小結 71
3.13 參考資料 71
第4章 統計學與線性代數 72
4.1 用NumPy進行簡單的描述性統計計算 72
4.2 用NumPy進行線性代數運算 75
4.2.1 用NumPy求矩陣的逆 75
4.2.2 用NumPy解線性方程組 77
4.3 用NumPy計算特徵值和特徵向量 78
4.4 NumPy隨機數 80
4.4.1 用二項式分布進行博弈 81
4.4.2 常態分配採樣 83
4.4.3 用SciPy進行正態檢驗 84
4.5 創建掩碼式NumPy數組 86
4.6 忽略負值和極值 88
4.7 小結 91
第5章 數據的檢索、加工與存儲 92
5.1 利用NumPy和pandas對CSV檔案進行寫操作 92
5.2 二進制.npy與pickle格式 94
5.3 使用PyTables存儲數據 97
5.4 Pandas DataFrame與HDF5倉庫之間的讀寫操作 99
5.5 使用Pandas讀寫Excel檔案 102
5.6 使用REST Web服務和JSON 103
5.7 使用Pandas讀寫JSON 105
5.8 解析RSS和Atom訂閱 106
5.9 使用Beautiful Soup解析HTML 108
5.10 小結 114
5.11 參考資料 114