Python數據科學實踐指南

Python數據科學實踐指南

《Python數據科學實踐指南》是機械工業出版社出版的圖書,作者是紀路。

基本介紹

  • 中文名:Python數據科學實踐指南
  • 作者:紀路
  • 出版時間:2017年5月19日
  • 出版社:機械工業出版社
  • 頁數:241 頁
  • ISBN:9787111566526
  • 定價:59.00 元
  • 裝幀:平裝
  • 叢書:大數據技術叢書
內容簡介,圖書目錄,作者簡介,

內容簡介

本書是一本Python數據科學的入門圖書,筆者結合多年工作和指導新人的經驗,希望以一條簡單的路線來為零基礎的讀者介紹數據科學。在本書中主要使用Python程式語言,來處理真實的數據,從而滿足我們對於未知的好奇。如果讀者喜歡其中的某一個領域,可以以此為契機進行深入的學習。 本書分為三大部分,第1~4章是Python基礎,在這個部分會介紹閱讀本書必須的Python知識,但並不會包含很複雜的編程知識,比如面向對象編程就不是必要的,因為Python支持過程式編程,可以直接編寫函式。第5~7章會講解Python直接提供的數據處理工具,這些工具包括一些易用的數據結構、標準庫和第三方工具。學習使用這些工具可以讓我們快速地實現某些簡單的算法,而不用花費大量的時間“重新發明輪子”,Python在處理數據時的高效在此處體現得淋漓盡致。第8~12章是一些實際的案例操作分解,涉及Python主要擅長的幾個領域:統計、爬蟲、科學計算、Hadoop&Spark中的集成、圖計算等。最後的三個附錄分別介紹了一些關於Python的擴展知識,比如如何編寫同時兼容Python2和Python3的代碼,如何安裝完整的Python開發環境,以及一些常用的Python技巧(處理時間、檔案I/O等)等。

圖書目錄

前言
第0章 發現、出發 1
0.1 何謂數據科學 1
0.1.1 海量的數據與科學的方法 2
0.1.2 數據科學並不是新概念 3
0.1.3 數據科學是一個系統工程 3
0.2 如何成為數據科學家 4
0.3 為什麼是Python 6
0.4 一個簡單的例子 8
第1章 Python介紹 9
1.1 Python的版本之爭 10
1.2 Python解釋器 11
1.2.1 Mac OS X系統 11
1.2.2 Linux系統 11
1.2.3 Windows系統 12
1.3 第一段Python程式 14
1.4 使用Python shell調試程式 15
第2章 Python基礎知識 19
2.1 應當掌握的基礎知識 19
2.1.1 基礎數據類型 19
2.1.2 變數和賦值 21
2.1.3 操作符及表達式 22
2.1.4 文本編輯器 23
2.2 字元串 27
2.3 獲取鍵盤輸入 29
2.4 流程控制 30
2.4.1 條件判斷 30
2.4.2 循環 31
2.4.3 縮進、空白和注釋 33
第3章 函式及異常處理 35
3.1 函式和函式的參數 36
3.1.1 定義函式 37
3.1.2 關鍵字參數和默認參數 38
3.1.3 可變數量的參數 39
3.1.4 遞歸 40
3.2 閉包 41
3.3 異常和斷言 44
第4章 高級字元串處理 47
4.1 字元集和字元編碼 47
4.1.1 ASCII字元集和編碼 48
4.1.2 Unicode字元集及UTF-8編碼 49
4.2 字元串操作和格式化 51
4.2.1 字元串的基本操作 51
4.2.2 字元串分割 52
4.2.3 字元串格式化 52
4.3 正則表達式 53
4.3.1 正則表達式入門 54
4.3.2 在Python中使用正則表達式 57
第5章 容器和collections 60
5.1 元組 60
5.2 列表 62
5.2.1 引用傳遞 64
5.2.2 列表解析式 65
5.3 字典 66
5.4 collections 69
5.4.1 namedtuple 69
5.4.2 Counter 70
5.4.3 defaultdict 71
5.4.4 OrderedDict 71
第6章 Python標準庫簡介 73
6.1 math模組 73
6.1.1 常見常量 73
6.1.2 無窮 74
6.1.3 整數轉換 75
6.1.4 絕對值和符號 76
6.1.5 常用計算 77
6.1.6 指數和對數 77
6.2 time 79
6.3 random 82
6.3.1 隨機數生成器 82
6.3.2 取樣 84
6.4 glob和fileinput 85
6.5 bz2和gzip 87
6.6 pprint 88
6.7 traceback 90
6.8 JSON 91
第7章 用Python讀寫外部數據 93
7.1 CSV檔案的讀寫 94
7.1.1 讀取CSV檔案 94
7.1.2 創建CSV檔案 95
7.1.3 處理方言 96
7.1.4 將讀取的結果轉換成字典 97
7.2 Excel檔案的讀寫 98
7.2.1 讀取Excel檔案 98
7.2.2 寫Excel檔案 99
7.3 MySQL的讀寫 101
7.3.1 寫入MySQL 103
7.3.2 讀取MySQL 105
第8章 統計編程 106
8.1 描述性統計 106
8.2 數據可視化入門 116
8.3 機率 122
第9章 爬蟲入門 124
9.1 網路資源及爬蟲的基本原理 124
9.2 使用request模組獲取HTML內容 127
9.3 使用Xpath解析HTML中的內容 133
9.4 實戰:爬取京東商品品類及品牌列表 144
第10章 數據科學的第三方庫介紹 149
10.1 Numpy入門和實戰 149
10.2 Pandas的入門和實戰 167
10.3 Scikit-learn入門和實戰 180
第11章 利用Python進行圖數據分析 193
11.1 圖基礎 193
11.2 NetworkX入門 194
11.3 使用NetworkX進行圖分析 199
第12章 大數據工具入門 204
12.1 Hadoop 204
12.2 Spark 211
12.3 大數據與數據科學的區別 215
附錄A 編寫Python 2與Python 3兼容的代碼 217
附錄B 安裝完整的Python開發環境 225
附錄C 常用的Python技巧 235

作者簡介

紀路,先進設計與智慧型計算教育部重點實驗室碩士,控制專業,研究生期間主攻機器人方向,對小眾程式語言和機器學習有濃厚的興趣。現在在一家大數據初創公司做數據挖掘工作,略通Python、Scala、JavaScript。由於有學術背景,並且熟悉多種編程範式,經常被委以算法研發的重任。主要負責計算廣告相關的算法、社交網路數據挖掘,以及高性能分散式計算平台的開發工作。

相關詞條

熱門詞條

聯絡我們