機器學習算法（原書第2版）

內容簡介

與機器學習領域很多偏重於理論的書相比，本書在簡明扼要地闡明基本原理的基礎上，側重於介紹如何在Python環境下使用機器學習方法庫，並通過大量實例清晰形象地展示了不同場景下機器學習方法的套用。從這個角度來說，本書是一本使機器學習算法通過Python實現真正“落地”的書，而這無疑將給想要或致力於機器學習套用的讀者帶來方法理解和實現上的巨大裨益。

書中所有實例都是用Python編寫，使用了scikit-learn機器學習框架、自然語言工具包（NLTK）、Crab、langdetect、Spark（PySpark）、Gensim、Keras和TensorFlow（深度學習框架）。這些程式適用於基於Linux、和Windows系統的Python 2.7和3.3+版本。

本書主要面向希望在預測分析和機器學習領域建立紮實基礎的機器學習工程師、數據工程師和數據科學家。

圖書目錄

譯者序

前言

第1章機器學習簡介

1.1簡介——經典機器和自適應的機器

1.1.1描述性分析

1.1.2預測性分析

1.2關於學習

1.2.1監督學習

1.2.2無監督學習

1.2.3半監督學習

1.2.4強化學習

1.2.5計算神經科學

1.3超越機器學習——深度學習和基於生物啟發的適應系統

1.4機器學習和大數據

1.5本章小結

第2章機器學習的重要元素

2.1數據格式

2.2可學習性

2.2.1欠擬合和過擬合

2.2.2誤差度量和成本函式

2.2.3PAC學習

2.3統計學習方法介紹

2.3.1最大後驗機率學習

2.3.2最大似然學習

2.4類平衡

2.4.1可置換的重採樣

2.4.2合成少數類過採樣

2.5資訊理論的要素

2.5.1熵

2.5.2交叉熵和互信息

2.5.3兩個機率分布的散度

2.6本章小結

第3章特徵選擇與特徵工程

3.1scikit-learn的toy數據集

3.2創建訓練集和測試集

3.3管理分類數據

3.4管理缺失特徵

3.5數據縮放和歸一化

3.6特徵選擇和過濾

3.7主成分分析

3.7.1非負矩陣分解

3.7.2稀疏PCA

3.7.3核PCA

3.8獨立成分分析

3.9原子提取和字典學習

3.10使用t-SNE可視化高維數據集

3.11本章小結

第4章回歸算法

機器學習算法（原書第2版）

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條