機器學習與R語言（原書第2版）

內容簡介

隨著大數據的概念變得越來越流行，對數據的探索、分析和預測成為大數據分析領域的基本技能之一。作為探索和分析數據的基本理論和工具，機器學習和數據挖掘成為時下熱門的技術。R作為功能強大並且免費的數據分析工具，在數據分析領域獲得了越來越多用戶的青睞。

本書通過清晰和實用的案例來探索機器學習在現實世界中的套用，不拘泥於機器學習，既適用於機器學習的初學者，也適用於具有一定經驗的讀者。

通過閱讀本書，你將學到：

用R準備用於機器學習的數據

用R進行數據探索和數據可視化

用k近鄰方法進行數據分類

用樸素貝葉斯方法進行數據分類

用決策樹、規則和支持向量機進行預測

用線性回歸預測數值型數據

用神經網路對數據建模

用購物籃分析的關聯規則找出數據中的模式

對數據聚類進行市場區隔

圖書目錄

推薦序

譯者序

前言

關於審稿人

第1章　機器學習簡介1

1.1　機器學習的起源1

1.2　機器學習的使用與濫用3

1.2.1　機器學習的成功使用3

1.2.2　機器學習的限制4

1.2.3　機器學習的倫理方面5

1.3　機器如何學習6

1.3.1　數據存儲7

1.3.2　抽象化7

1.3.3　一般化9

1.3.4　評估10

1.4　實踐中的機器學習11

1.4.1　輸入數據的類型11

1.4.2　機器學習算法的類型12

1.4.3　為輸入數據匹配算法14

1.5　使用R進行機器學習15

1.5.1　安裝R添加包15

1.5.2　載入和卸載R添加包16

1.6　總結16

第2章　數據的管理和理解18

2.1　R數據結構18

2.1.1　向量18

2.1.2　因子20

2.1.3　列表21

2.1.4　數據框23

2.1.5　矩陣和數組25

2.2　用R管理數據27

2.2.1　保存、載入和移除R數據結構27

2.2.2　用CSV檔案導入和保存數據28

2.3　探索和理解數據29

2.3.1　探索數據的結構29

2.3.2　探索數值變數30

2.3.3　探索分類變數38

2.3.4　探索變數之間的關係40

2.4　總結43

第3章　懶惰學習—使用近鄰分類44

3.1　理解近鄰分類44

3.1.1　kNN算法45

3.1.2　為什麼kNN算法是懶惰的50

3.2　例子—用kNN算法診斷乳腺癌51

機器學習與R語言（原書第2版）

基本介紹

內容簡介

圖書目錄

相關詞條

熱門詞條