Python數據科學實踐

Python數據科學實踐

《Python數據科學實踐》是2020年北京大學出版社出版圖書,作者是常象宇、曾智億、李春艷、程茜。

基本介紹

  • 書名:Python數據科學實踐
  • 作者:常象宇、曾智億、李春艷、程茜 
  • 出版社:北京大學出版社 
  • 出版時間:2020年7月1日
  • 頁數:284 頁
  • 開本:16 開
  • 裝幀:平裝
  • ISBN:9787301313190 
  • 字數:382000
  • 用紙:膠版紙
內容簡介,目錄,

內容簡介

《Python數據科學實踐》是由狗熊會推出的一本利用Python介紹數據科學基本過程的著作。本書以Python語言為基礎,介紹利用Python進行數據科學研究與商業分析的全貌。其核心的設計理念是通過經典的商業套用案例對數據爬取、數據存儲、數據清洗、數據建模的核心Python模組做相應的介紹。
本書的特點是強調數據科學帶來的商業價值理念,所以其可以作為高等學校數據科學、大數據管理與套用、統計或相關專業的教材,也適合從事數據分析的工作者和愛好者閱讀。

目錄

第1章 基於Python的數據科學環境搭建 1
1.1 Python是數據科學 “大勢所趨”2
1.2 Anaconda入門 ——工欲善其事,必先利其器 4
1.3 Jupyter Notebook入門 15
1.4 Markdown單元格的使用 25
1.5 Spyder入門 34
1.6 小結 38
第2章 Python基礎 39
2.1 “火鍋團購數據”簡介 40
2.2 讀寫數據 41
2.3 Python數據類型與結構 44
2.4 控制流、函式與模組 58
2.5 面向對象編程的基本概念 66
2.6 Numpy簡介 72
2.7 小結 77
第3章 Python的數據處理模組 78
3.1 初級篇 ——相遇 Pandas79
3.2 進階篇 ——相識 Pandas90
3.3 小結 99
第4章 Python的繪圖模組 100
4.1 為什麼需要數據可視化 101
4.2 初級篇 ——Matplotlib基礎 102
4.3 高級篇 ——Plotly基礎 121
4.4 小結 139
第5章 Python的統計建模模組 141
5.1 Statsmodels簡介 142
5.2 數據接入 143
5.3 統計模型參數估計 145
5.4 統計假設檢驗 153
5.5 探索分析 159
5.6 小結 165
第6章 Python的機器學習模組 166
6.1 機器學習的定義 167
6.2 使用 scikit -learn169
6.3 小結 182
第7章 Python的爬蟲模組 183
7.1 爬蟲的定義 184
7.2 初級篇 ——單頁面靜態爬蟲 185
7.3 中級篇 ——多頁面靜態爬蟲 197
7.4 高級篇 ——爬蟲的偽裝 205
7.5 終級篇 ——動態爬蟲 212
7.6 爬蟲注意事項 217
7.7 小結 217
第8章 Python的文本分析模組 218
8.1 準備 :理解文本分析流程 219
8.2 實戰 224
8.3 小結 232
第9章 Python的資料庫模組 233
9.1 為什麼需要資料庫 234
9.2 初級篇 ——SQLAlchemy的基本使用 235
9.3 高級篇 244
9.4 小結 248
第10章 精品案例——火鍋團購分析 249
10.1 背景介紹 250
10.2 數據描述 252
10.3 建模分析 264
10.4 小結 269

相關詞條

熱門詞條

聯絡我們