預測分析：Python語言實現

內容簡介

本書著重介紹預測性分析技術，先概述了數據分析系統的基本架構和主要處理流程，然後從分類和無監督學習開始，逐一講解每種機器學習算法的工作原理，並在每一章的後給出了詳細的案例討論。高質量的數據是能夠進行正確分析的前提，為了便於後期分析模型的構建，本書還會介紹對於不同類型數據的清洗和過濾等內容。通過學習本書的內容，讀者將了解將原始數據轉化為重要結論的過程，並掌握快速將其中涉及的模型套用到自有數據中的方法。

圖書目錄

譯者序

關於審稿人

前言

第1章數據轉換成決策——從分析套用著手

1.1設計高級分析方案

1.1.1數據層：數據倉庫、數據湖和數據流

1.1.2模型層

1.1.3部署層

1.1.4報告層

1.2案例學習：社交媒體數據的情感分析

1.2.1數據輸入和轉換

1.2.2合理性檢查

1.2.3模型開發

1.2.4評分

1.2.5可視化和報告

1.3案例學習：針對性電子郵件活動

1.3.1數據輸入和轉換

1.3.2合理性檢查

1.3.3模型開發

1.3.4評分

1.3.5可視化和報告

1.4總結

第2章Python數據分析和可視化初探

2.1在IPython中探索分類和數值型數據

2.1.1安裝IPython notebook

2.1.2notebook的界面

2.1.3載入和檢視數據

2.1.4基本操作——分組、過濾、映射以及透視

2.1.5用Matplotlib繪製圖表

2.2時間序列分析

2.2.1清洗和轉換

2.2.2時間序列診斷

2.2.3連線信號和相關性

2.3操作地理數據

2.3.1載入地理數據

2.3.2工作在雲上

2.4PySpark簡介

2.4.1創建SparkContext

2.4.2創建RDD

2.4.3創建Spark DataFrame

2.4總結

第3章在噪聲中探求模式——聚類和無監督學習

3.1相似性和距離度量

3.1.1數值距離度量

3.1.2相關相似性度量和時間序列

3.1.3分類數據的相似性度量

3.1.4k均值聚類

預測分析：Python語言實現

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條