利用Python進行數據分析

利用Python進行數據分析

《利用Python進行數據分析》是2013年機械工業出版社出版的軟硬體開發類圖書,作者是麥金尼。講述了從pandas庫的數據分析工具開始利用高性能工具、matpIotlib、pandas的groupby功能等處理各種各樣的時間序列數據。

基本介紹

  • 書名:利用Python進行數據分析
  • 作者:Wes McKinney  
  • 類別:軟硬體開發
  • 出版社:機械工業出版社
  • 出版時間:2013年10月30日
  • 定價:89 元
  • ISBN:9787111436737 
  • 著作權方:北京華章圖文信息有限公司
圖書簡介,作者簡介,圖書目錄,

圖書簡介

從pandas庫的數據分析工具開始利用高性能工具對數據進行載入、清理、轉換、合併以及重塑;利用matpIotlib創建散點圖以及靜態或互動式的可視化結果;利用pandas的groupby功能對數據集進行切片、切塊和匯總操作;處理各種各樣的時間序列數據。
《利用Python進行數據分析》適合剛剛接觸Python的分析人員以及剛剛接觸科學計算的Python程式設計師。將IPython這個互動式Shell作為你的首要開發環境。

作者簡介

WesMcKinney,資深數據分析專家,對各種Python庫等都有深入研究,並在大量的實踐中積累了豐富的經驗。撰寫了大量與Python數據分析相關的經典文章,被各大技術社區爭相轉載,是Python和開源技術社區公認的權威人物之一。開發了用於數據分析的著名開源Python庫――pandas,廣獲用戶好評。

圖書目錄

目錄
前言 1
第1章 準備工作 5
本書主要內容 5
為什麼要使用Python進行數據分析 6
重要的Python庫 7
安裝和設定 10
社區和研討會 16
使用本書 16
致謝 18
第2章 引言 20
來自bit.ly的1usagov數據 21
MovieLens 1M數據集 29
1880—2010年間全美嬰兒姓名 35
小結及展望 47
第3章 IPython:一種互動式計算和開發環境 48
IPython基礎 49
內省 51
使用命令歷史 60
與作業系統互動 63
軟體開發工具 66
IPython HTML Notebook 75
利用IPython提高代碼開發效率的幾點提示 77
高級IPython功能 79
致謝 81
第4章 NumPy基礎:數組和矢量計算 82
NumPy的ndarray:一種多維數組對象 83
通用函式:快速的元素級數組函式 98
利用數組進行數據處理 100
用於數組的檔案輸入輸出 107
線性代數 109
隨機數生成 111
範例:隨機漫步 112
第5章 pandas入門 115
pandas的數據結構介紹 116
基本功能 126
匯總和計算描述統計 142
處理缺失數據 148
層次化索引 153
其他有關pandas的話題 158
第6章 數據載入、存儲與檔案格式 162
讀寫文本格式的數據 162
二進制數據格式 179
使用HTML和Web API 181
使用資料庫 182
第7章 數據規整化:清理、轉換、合併、重塑 186
合併數據集 186
重塑和軸向旋轉 200
數據轉換 204
字元串操作 217
示例:USDA食品資料庫 224
第8章 繪圖和可視化 231
matplotlib API入門 231
pandas中的繪圖函式 244
繪製地圖:圖形化顯示海地地震危機數據 254
Python圖形化工具生態系統 260
第9章 數據聚合與分組運算 263
GroupBy技術 264
數據聚合 271
分組級運算和轉換 276
透視表和交叉表 288
示例:2012聯邦選舉委員會資料庫 291
第10章 時間序列 302
日期和時間數據類型及工具 303
時間序列基礎 307
日期的範圍、頻率以及移動 311
時區處理 317
時期及其算術運算 322
重採樣及頻率轉換 327
時間序列繪圖 334
移動視窗函式 337
性能和記憶體使用方面的注意事項 342
第11章 金融和經濟數據套用 344
數據規整化方面的話題 344
分組變換和分析 355
更多示例套用 361
第12章 NumPy高級套用 368
ndarray對象的內部機理 368
高級數組操作 370
廣播 378
ufunc高級套用 383
結構化和記錄式數組 386
更多有關排序的話題 388
NumPy的matrix類 393
高級數組輸入輸出 395
性能建議 397
附錄A Python語言精要 401

相關詞條

熱門詞條

聯絡我們