Python數據科學導論：概念、技術與套用

內容簡介

《Python數據科學導論》通過理論與實踐相結合的方式來闡述數據科學的一系列重要概念及算法，以使讀者學會如何管理並利用數據。本書共有11章，第1章概要地介紹了數據科學的現狀並給出了一些使用本書的建議；第2章介紹了Python語言數據科學生態系統，涉及NumPy、SciPy和Pandas等熱門第三方庫；第3～7章著重講解了統計學和機器學習的知識，涉及描述統計學、統計推斷、監督學習、回歸分析、無監督學習等主題；第8～10章詳細介紹了數據科學的一些主要套用，如網路分析、推薦系統和情感分析；第11章介紹了並行計算及性能最佳化方法。

作者簡介

章宗長博士，蘇州大學特聘副教授，碩士生導師，網易人工智慧研究顧問。2012年6月畢業於中國科學技術大學計算機套用技術專業，獲工學博士學位。2010年10月-2011年10月在美國羅格斯大學計算機科學系做訪問學者，2012年8-10月在華為諾亞方舟實驗室擔任研究工程師，2012年11月-2014年6月在新加坡國立大學計算學院從事博士後研究，2014年7月起在蘇州大學工作。目前主要從事部分可觀測馬氏決策過程（POMDPs）、強化學習和多智慧型體系統理論等方面的研究。

圖書目錄

譯者序

原書前言

作者和貢獻者簡介

第1章數據科學概述 // 1

1.1　什麼是數據科學 //1

1.2　關於本書 //2

第2章　數據專家的工具箱 //4

2.1　引言 // 4

2.2　為什麼選擇Python // 4

2.3　數據專家的基本Python庫 // 5

2.3.1　數值和科學計算：NumPy和SciPy // 5

2.3.2　Scikit-learn：Python中的機器學習庫 // 5

2.3.3　Pandas：Python數據分析庫 // 5

2.4　數據科學生態系統的安裝 // 6

2.5　集成開發環境 // 6

2.5.1　網路集成開發環境：Jupyter // 7

2.6　數據專家從Python開始 // 7

2.6.1　讀取 // 11

2.6.2　選擇數據 // 13

2.6.3　篩選數據 // 14

2.6.4　篩選缺失的數據 // 15

2.6.5　處理數據 // 15

2.6.6　排序 // 19

2.6.7　分組數據 // 20

2.6.8　重排數據 // 21

2.6.9　對數據進行排名 // 22

2.6.10　繪圖 // 23

2.7　小結 // 24

第3章　描述統計學 // 25

Python數據科學導論：概念、技術與套用

基本介紹

內容簡介

作者簡介

圖書目錄

相關詞條

熱門詞條