《深入淺出Pandas:利用Python進行數據處理與分析》由機械工業出版社出版,作者是李慶輝,既是初學者系統學習Pandas難得的入門書,又是有經驗的Python工程師案頭必不可少的查詢手冊。
基本介紹
- 中文名:深入淺出Pandas
- 別名:利用Python進行數據處理與分析
- 作者:李慶輝
- 出版社:機械工業出版社
- 出版時間:2021年7月1日
- 頁數:410 頁
- 定價:99 元
- 開本:16 開
- 裝幀:平裝
- ISBN:9787111685456
內容簡介,圖書目錄,作者簡介,
內容簡介
如果你想充分發揮Python的強大作用,如果你想成為一名好的Python工程師,你應該先學好Pandas。
這是一本全面覆蓋了Pandas使用者的普遍需求和痛點的著作,基於實用、易學的原則,從功能、使用、原理等多個維度對Pandas做了全方位的詳細講解,既是初學者系統學習Pandas難得的入門書,又是有經驗的Python工程師案頭必不可少的查詢手冊。
本書共17章,分為七部分。
第1部分(第1~2章) Pandas入門
首先介紹了Pandas的功能、使用場景和學習方法,然後詳細講解了Python開發環境的搭建,Z後介紹了Pandas的大量基礎功能,旨在幫助讀者快速入門。
第二部分(第3~5章) Pandas數據分析基礎
詳細講解了Pandas讀取與輸出數據、索引操作、數據類型轉換、查詢篩選、統計計算、排序、位移、數據修改、數據疊代、函式套用等內容。
圖書目錄
前言
部分 Pandas入門
第1章 Pandas簡介及快速入門2
1.1 Pandas是什麼2
1.1.1 Python簡介2
1.1.2 Python的套用3
1.1.3 為什麼不選擇R4
1.1.4 Pandas簡介4
1.1.5 Pandas的使用人群5
1.1.6 Pandas的基本功能5
1.1.7 Pandas的學習方法6
1.1.8 小結6
1.2 環境搭建及安裝6
1.2.1 Python環境安裝7
1.2.2 Anaconda簡介7
1.2.3 安裝miniconda8
1.2.4 多Python版本環境9
1.2.5 安裝編輯器10
1.2.6 Jupyter Notebook10
1.2.7 用pip安裝三方庫11
1.2.8 安裝Jupyter Notebook12
1.2.9 啟動Jupyter Notebook12
1.2.10 使用Jupyter Notebook13
1.2.11 安裝Pandas14
1.2.12 小結14
1.3 Pandas快速入門14
1.3.1 安裝導入14
1.3.2 準備數據集15
1.3.3 讀取數據15
1.3.4 查看數據16
1.3.5 驗證數據17
1.3.6 建立索引17
1.3.7 數據選取18
1.3.8 排序19
1.3.9 分組聚合19
1.3.10 數據轉換20
1.3.11 增加列21
1.3.12 統計分析21
1.3.13 繪圖21
1.3.14 導出24
1.3.15 小結24
1.4 本章小結24
第2章 數據結構25
2.1 數據結構概述25
2.1.1 什麼是數據25
2.1.2 什麼是數據結構26
2.1.3 小結26
2.2 Python的數據結構26
2.2.1 數字27
2.2.2 字元串27
2.2.3 布爾型28
2.2.4 列表29
2.2.5 元組30
2.2.6 字典30
2.2.7 集合31
2.2.8 小結32
2.3 NumPy32
2.3.1 NumPy簡介33
2.3.2 數據結構33
2.3.3 創建數據34
2.3.4 數據類型34
2.3.5 數組信息35
2.3.6 統計計算35
2.3.7 小結35
2.4 Pandas的數據結構35
2.4.1 Series36
2.4.2 DataFrame36
2.4.3 索引37
2.4.4 小結38
2.5 Pandas生成數據38
2.5.1 導入Pandas38
2.5.2 創建數據38
2.5.3 生成Series40
2.5.4 生成DataFrame41
2.5.5 小結43
2.6 Pandas的數據類型43
2.6.1 數據類型查看43
2.6.2 常見數據類型44
2.6.3 數據檢測44
2.6.4 小結45
2.7 本章小結45
第二部分 Pandas數據分析基礎
第3章 Pandas數據讀取與輸出48
3.1 數據讀取48
3.1.1 CSV檔案49
3.1.2 Excel49
3.1.3 JSON 50
3.1.4 HTML50
3.1.5 剪貼簿51
3.1.6 SQL51
3.1.7 小結52
3.2 讀取CSV52
3.2.1 語法52
3.2.2 數據內容53
3.2.3 分隔設定53
3.2.4 表頭54
3.2.5 列名54
3.2.6 索引54
3.2.7 使用部分列54
3.2.8 返回序列55
3.2.9 表頭前綴55
3.2.10 處理重複列名55
3.2.11 數據類型55
3.2.12 引擎55
3.2.13 列數據處理56
3.2.14 真假值轉換56
3.2.15 跳過指定行56
3.2.16 讀取指定行57
3.2.17 空值替換57
3.2.18 保留默認空值57
3.2.19 日期時間解析58
3.2.20 檔案處理59
3.2.21 符號60
3.2.22 小結61
3.3 讀取Excel61
3.3.1 語法61
3.3.2 檔案內容62
3.3.3 表格62
3.3.4 表頭62
3.3.5 列名62
3.3.6 其他62
3.3.7 小結63
3.4 數據輸出63
3.4.1 CSV63
3.4.2 Excel63
3.4.3 HTML64
3.4.4 資料庫(SQL)64
3.4.5 Markdown65
3.4.6 小結65
3.5 本章小結65
第4章 Pandas基礎操作66
4.1 索引操作66
4.1.1 認識索引66
4.1.2 建立索引67
4.1.3 重置索引68
4.1.4 索引類型68
4.1.5 索引對象69
4.1.6 索引的屬性70
4.1.7 索引的操作70
4.1.8 索引重命名72
4.1.9 修改索引內容72
4.1.10 小結73
4.2 數據的信息73
4.2.1 查看樣本73
4.2.2 數據形狀74
4.2.3 基礎信息74
4.2.4 數據類型74
4.2.5 行列索引內容75
4.2.6 其他信息75
4.2.7 小結75
4.3 統計計算76
4.3.1 描述統計76
4.3.2 數學統計77
4.3.3 統計函式78
4.3.4 非統計計算79
4.3.5 小結80
4.4 位置計算80
4.4.1 位置差值diff( )80
4.4.2 位置移動shift( )81
4.4.3 位置序號rank( )81
4.4.4 小結82
4.5 數據選擇82
4.5.1 選擇列83
4.5.2 切片 [ ]83
4.5.3 按軸標籤.loc84
4.5.4 按數字索引.iloc86
4.5.5 取具體值.at/.iat86
4.5.6 獲取數據.get86
4.5.7 數據截取.truncate87
4.5.8 索引選擇器87
4.5.9 小結87
4.6 本章小結88
第5章 Pandas高級操作89
5.1 複雜查詢89
5.1.1 邏輯運算89
5.1.2 邏輯篩選數據91
5.1.3 函式篩選92
5.1.4 比較函式92
5.1.5 查詢df.query( )93
5.1.6 篩選df.filter( )93
5.1.7 按數據類型查詢93
作者簡介
李慶輝
數據產品專家,某電商公司數據產品團隊負責人,擅長通過數據治理、數據分析、數據化運營提升公司的數據套用水平。
精通Python數據科學及Python Web開發,曾獨立開發公司的自動化數據分析平台,參與教育部“1 X”數據分析(Python)職業技能等級標準評審。
中國人工智慧學會會員,企業數位化、數據產品和數據分析講師,在個人網站“蓋若”上編寫的技術和產品教程廣受歡迎。