R統計高級編程和數據模型分析、機器學習和可視化

R統計高級編程和數據模型分析、機器學習和可視化

《R統計高級編程和數據模型分析、機器學習和可視化》是2020年清華大學出版社出版的圖書,作者是馬特·威利(Matt Wiley)、約書亞·F.威利(Joshua,F.,Wiley)。

基本介紹

  • 中文名:R統計高級編程和數據模型分析、機器學習和可視化
  • 作者:馬特·威利(Matt Wiley)、約書亞·F.威利(Joshua,F.,Wiley)
  • 出版社: 清華大學出版社  
  • 出版時間:2020年7月1日
  • 定價:128 元
  • ISBN:9787302557005
內容簡介,圖書目錄,

內容簡介

● 如何使用R語言進行高級數據分析,涉及的技術包括廣義線性模型、廣義可加模型、混合效應模型、機器學習、並行處理
● 如何使用R語言的數據可視化技術實現回歸,如線性回歸和高級回歸,並了解回歸樣條和可加模型
● 如何使用R語言實現機器學習,包含平行處理、降維、特徵選取和分類
● 如何使用R語言的多重插補技術解決數據缺失問題
● 如何使用廣義線性可加模型實現普通量、二值量和計次量的輸出,如何使用自採樣法(Bootstrapping)分析不確定性
● 學習如何對個體內的變異性進行建模,進而捕捉個體在方法以及時間穩定性上的差異

圖書目錄

第1章 單變數數據可視化 1
1.1 分布 2
1.1.1 可視化觀測數據的分布 2
1.1.2 堆積點陣圖與直方圖 2
1.1.3 經驗密度圖 4
1.1.4 比較觀測分布與期望分布 6
1.1.5 Q-Q圖 7
1.1.6 比較經驗密度圖與期望分布的密度圖 10
1.1.7 其他分布的擬合 11
1.2 異常值 16
1.3 小結 23
第2章 多變數數據可視化 25
2.1 分布 25
2.2 奇異值 30
2.3 變數之間的關係 33
2.4 小結 45
第3章 GLM Ⅰ 47
3.1 概念背景 48
3.2 分類預測器和虛擬編碼 49
3.2.1 二級分類預測器 49
3.2.2 三級或三級以上的分類預測值 50
3.3 互動作用和調節效應 52
3.4 公式接口 53
3.5 方差分析 55
3.5.1 概念背景 55
3.5.2 R語言的ANOVA函式 58
3.6 線性回歸 61
3.6.1 概念背景 61
3.6.2 R語言中的線性回歸 62
3.6.3 高性能線性回歸 76
3.7 控制混合影響 78
3.8 案例研究:多線性回歸與互動作用 86
3.9 小結 93
第4章 GLM Ⅱ 95
4.1 概念背景 96
4.1.1 Logistic回歸 96
4.1.2 計數回歸 97
4.2 R程式示例 99
4.2.1 二項Logistic回歸 99
4.2.2 有序Logistic回歸 106
4.2.3 多分類Logistic回歸 109
4.2.4 泊松回歸和負二項回歸 113
4.3 案例研究:多項Logistic回歸 119
4.4 小結 127
第5章 廣義可加模型 129
5.1 概念背景 130
5.2 R語言中的GAM模型 136
5.2.1 高斯因變數 136
5.2.2 二值因變數 159
5.2.3 無序因變數 164
5.2.4 計數因變數 168
5.3 小結 176
第6章 機器學習:引言 179
6.1 訓練數據和驗證數據 180
6.2 重採樣和交叉驗證 186
6.3 自採樣法 189
6.4 並行處理和隨機數 191
6.5 小結 198
第7章 機器學習:無監督學習 201
7.1 數據背景和探索性分析 202
7.2 k-均值聚類算法 212
7.3 層次聚類算法 223
7.4 主成分分析 235
7.5 非線性聚類分析 245
7.6 小結 246
第8章 機器學習:監督學習 249
8.1 數據準備 250
8.1.1 獨熱編碼 252
8.1.2 定標化與中心化 254
8.1.3 變換 255
8.1.4 訓練數據與驗證數據 260
8.1.5 主成分分析 261
8.2 監督學習模型 266
8.2.1 支持向量機 267
8.2.2 分類與回歸樹 276
8.2.3 隨機森林 282
8.2.4 隨機梯度提升 288
8.2.5 多層感知機 297
8.3 小結 318
第9章 缺失數據 321
9.1 概念背景 322
9.2 R示例 328
9.2.1 回歸模型與多重插補 332
9.2.2 多重插補與並行處理 342
9.2.3 使用隨機森林法實現多重插補 345
9.3 案例研究:使用RF實現多重插補 349
9.4 小結 360
第10章 GLMM:引言 361
10.1 多層數據 362
10.1.1 數據重整 363
10.1.2 日記研究數據集 365
10.2 描述性統計量 368
10.2.1 基本描述量 370
10.2.2 組內相關係數(ICC) 376
10.3 探索與假設 379
10.3.1 分布與奇異值 379
10.3.2 時間趨勢 384
10.3.3 自相關 386
10.3.4 假設 390
10.4 小結 395
第11章 GLMM:線性 397
11.1 理論 398
11.1.1 廣義線性混合模型 398
11.1.2 術語混合效應和多層次模型 401
11.1.3 統計推斷 402
11.1.4 效應量 403
11.1.5 隨機截距模型 404
11.1.6 可視化隨機效應 404
11.1.7 解釋隨機截距模型 409
11.1.8 隨機截距斜率模型 416
11.1.9 將截距和斜率作為因變數 420
11.2 R示例 425
11.2.1 隨機截距的線性混合模型 425
11.2.2 隨機截距和隨機斜率的線性混合模型 437
11.3 小結 453
第12章 GLMM:高級 457
12.1 概念背景 458
12.2 Logistic廣義線性混合模型 458
12.2.1 隨機截距 458
12.2.2 隨機截距和隨機斜率 463
12.3 泊松分布和負二項分布GLMM 467
12.3.1 隨機截距 467
12.3.2 隨機截距和隨機斜率 477
12.4 小結 486
第13章 建模IIV 489
13.1 概念背景 490
13.1.1 貝葉斯推斷 490
13.1.2 什麼是IIV 490
13.1.3 將IIV作為預測量 495
13.1.4 軟體實現:VARIAN 499
13.2 R程式示例 500
13.3 小結 508

相關詞條

熱門詞條

聯絡我們