Python數據分析師修煉之道

Python數據分析師修煉之道

《Python數據分析師修煉之道》是2019年清華大學出版社出版的圖書,作者是阿爾瓦羅?富恩特斯。

基本介紹

  • 中文名:Python數據分析師修煉之道
  • 作者:[美] 阿爾瓦羅?富恩特斯
  • 譯者:劉璋
  • 出版時間:2019年06月01日 
  • 出版社: 清華大學出版社  
  • ISBN:9787302530169 
  • 定價:69 元 
  • 印刷日期:2019.05.27 
圖書內容,作者簡介,目錄,

圖書內容

本書詳細闡述了與Python數據分析相關的基本解決方案,主要包括Anaconda和Jupyter Notebook、NumPy向量計算、數據分析庫pandas、可視化和數據分析、Python統計計算、預測分析模型等內容。此外,本書還提供了相應的示例、代碼,以幫助讀者進一步理解相關方案的實現過程。 本書既可作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。
Python數據分析師修煉之道
Python數據分析師修煉之道

作者簡介

Python是高級數據分析師和統計人員所用的最常見和最流行的語言之一,可用於處理大型數據集和複雜的數據可視化任務。
本書介紹了Python語言中的核心工具和庫,以幫助讀者與數據分析處理過程協同工作、準備相關數據以執行簡單的統計學分析,進而構建具有實際意義的數據可視化結果。本書將討論Python語言中的各種庫,如NumPy、pandas、matplotlib、seaborn、SciPy和scikit-learn,並將其套用於實際數據分析和統計示例中。在閱讀過程中,讀者將會領略到如何高效地使用Jupyter Noyebook,並藉助於NumPy和landas庫對數據進行操控。此外,還將利用Python庫實現簡單的預測模型、統計計算-分析和數據分析技術。

目錄

第1章 Anaconda和Jupyter Notebook 1
1.1 Anaconda 1
1.2 Jupyter Notebook 3
1.2.1 創建自己的Jupyter Notebook 3
1.2.2 Jupyter Notebook用戶界面 4
1.3 使用Jupyter Notebook 5
1.3.1 在代碼單元格中運行代碼 5
1.3.2 在文本單元格中運行markdown語法 6
1.3.3 鍵盤快捷操作 9
1.4 本章小結 10
第2章 NumPy向量計算 11
2.1 NumPy簡介 11
2.2 NumPy數組 13
2.2.1 在NumPy中創建數組 13
2.2.2 數組的屬性 16
2.2.3 數組中的基本數學運算 17
2.2.4 數組的常見操作 19
2.3 使用NumPy進行模擬 23
2.3.1 投擲硬幣 23
2.3.2 模擬股票收益 25
2.4 本章小結 27
第3章 數據分析庫pandas 29
3.1 pandas庫 29
3.1.1 導入pandas中的對象 30
3.1.2 Series 30
3.1.3 創建pandas中的Series 31
3.1.4 DataFrame 34
3.1.5 創建pandas DataFrame 35
3.1.6 剖析DataFrame 36
3.2 pandas操作 37
3.2.1 檢查數據 37
3.2.2 數據的選取、添加和刪除 37
3.2.3DataFrame切片40
3.2.4基於標記的選擇操作40
3.3數據集42
3.3.1數據集中按部門劃分的員工數量42
3.3.2員工的流失率42
3.3.3平均時薪43
3.3.4平均工作年限43
3.3.5任職時間最長的員工44
3.3.6員工的整體滿意度44
3.4進一步思考46
3.4.1低滿意度員工46
3.4.2低工作滿意度和低工作參與度的員工47
3.4.3員工比較48
3.5本章小結53
第4章可視化和數據分析55
4.1matplotlib簡介55
4.2pyplot簡介58
4.3面向對象接口64
4.4常見的自定義方式70
4.4.1顏色70
4.4.2限定坐標軸71
4.4.3設定刻度和刻度標記71
4.4.4圖例73
4.4.5標註74
4.4.6生成格線、水平線和垂直線75
4.5基於seaborn和pandas的EDA76
4.5.1seaborn庫76
4.5.2執行探索性數據分析77
4.5.3核心目標78
4.5.4變數類型78
4.6單獨分析變數79
4.6.1理解主變數80
4.6.2數值變數81
4.6.3類別變數83
4.7變數間的關係86
4.7.1散點圖86
4.7.2箱形圖89
4.7.3複雜的條件圖92
4.8本章小結94
第5章Python統計計算95
5.1SciPy簡介95
5.1.1統計子包95
5.1.2置信區間98
5.1.3機率計算100
5.2假設測試101
5.3執行統計測試102
5.4本章小結107
第6章預測分析模型109
6.1預測分析和機器學習109
6.2理解scikit-learn庫110
6.3使用scikit-learn構建回歸模型113
6.4利用回歸模型預測房屋價格118
6.5本章小結122

熱門詞條

聯絡我們