《統計學習導論——基於R套用》是2017年12月8日機械工業出版社出版的圖書,作者是(美)加雷斯.詹姆斯、丹妮拉·威滕、特雷弗·哈斯帖,譯者是王星。
基本介紹
- 書名:統計學習導論——基於R套用
- 作者:(美)加雷斯.詹姆斯、丹妮拉·威滕、特雷弗·哈斯帖
- 譯者:王星
- 出版社:機械工業出版社
- 出版時間:2017年12月8日
- 開本:16 開
- ISBN:9787111497714
- 印次:1-5
- 叢書名:數據科學與工程技術叢書
- 千字數:568
內容簡介,作者簡介,圖書目錄,
內容簡介
本書概述了統計學習領域,提供了理解大數據和複雜數據必不可少的工具,這些數據來自近20年來生物學、金融學、市場行銷學和天體物理學等領域。書中介紹了一些最重要的建模方法和預測技術,以及它們的相關套用。內容涉及線性回歸、分類、再抽樣方法、壓縮方法、基於樹的方法和聚類等,用彩圖和實例來闡釋相關方法。因為本教材的主要目標是方便自然科學、工業和其他領域的從業者使用統計學習技術,所以每章都有在R中實現所介紹的分析方法的指導內容。本書只假定讀者先修《線性回歸》課程,並不要求讀者具有矩陣代數知識。讀者對象是那些希望利用前沿的統計學習技術來分析數據的人士,既包括統計學專業的師生,也包括非統計學專業的人員。
作者簡介
Gareth James 史丹福大學統計學博士畢業,師從Trevor Hastie。現為南加州大學馬歇爾商學院統計學教授,美國統計學會會士,數理統計協會終身會員,紐西蘭統計協會會員。《Statistica Sinica》、《Applications and Case Studies》、《Theory and Methods》等期刊的副主編。
Daniela Witten 史丹福大學統計學博士畢業,師從Robert Tibshirani。現為華盛頓大學生物統計學副教授,美國統計學會和國際數理統計協會會士,《Journal of Computational and Graphical Statistics》和《Biometrika》等期刊副主編。
Trevor Hastie 美國統計學家和計算機科學家,史丹福大學統計學教授,英國皇家統計學會、國際數理統計協會和美國統計學會會士。Hastie參與開發了 R 中的大部分統計建模軟體和環境,發明了主曲線和主曲面。
Robert Tibshirani 史丹福大學統計學教授,國際數理統計協會、美國統計學會和加拿大皇家學會會士,1996年COPSS總統獎得主,提出lasso方法。Hastie和Tibshirani都是統計學習領域的泰山北斗,兩人合著《The Elements of Statistical Learning》,還合作講授史丹福大學的公開課《統計學習》。
圖書目錄
中文版序
譯者序
前言
第1章導論
11統計學習概述
12統計學習簡史
13關於這本書
14這本書適用的讀者群
15記號與簡單的矩陣代數
16本書的內容安排
17用於實驗和習題的數據集
18本書網站
19致謝
第2章統計學習
21什麼是統計學習
22評價模型精度
23實驗: R語言簡介
24習題
第3章線性回歸
31簡單線性回歸
32多元線性回歸
33回歸模型中的其他注意事項
34行銷計畫
35線性回歸與K最近鄰法的比較
36實驗:線性回歸
37習題
第4章分類
41分類問題概述
42為什麼線性回歸不可用
43邏輯斯諦回歸
44線性判別分析
45分類方法的比較
46R實驗:邏輯斯諦回歸、LDA、QDA和KNN
47習題
第5章重抽樣方法
51交叉驗證法
52自助法
53實驗:交叉驗證法和自助法
54習題
第6章線性模型選擇與正則化
61子集選擇
62壓縮估計方法
63降維方法
64高維問題
65實驗1:子集選擇方法
66實驗2:嶺回歸和lasso
67實驗3:PCR和PLS回歸
68習題
第7章非線性模型
71多項式回歸
72階梯函式
73基函式
74回歸樣條
75光滑樣條
76局部回歸
77廣義可加模型
78實驗:非線性建模
79習題
第8章基於樹的方法
81決策樹基本原理
82裝袋法、隨機森林和提升法
83實驗:決策樹
84習題
第9章支持向量機
91最大間隔分類器
92支持向量分類器
93狹義的支持向量機
94多分類的SVM
95與邏輯斯諦回歸的關係
96實驗:支持向量機
97習題
第10章無指導學習
101無指導學習的挑戰
102主成分分析
103聚類分析方法
104實驗1:主成分分析
105實驗2:聚類分析
106實驗3:以NCI60數據為例
107習題