《醫學數據挖掘案例與實踐(第2版)》是2023年清華大學出版社出版的圖書,作者是華琳、李林、夏翃、鄭衛英、安立、劉薇、信中。
基本介紹
- 中文名:醫學數據挖掘案例與實踐(第2版)
- 作者:華琳、李林、夏翃、鄭衛英、安立、劉薇、信中
- 出版時間:2023年5月1日
- 出版社:清華大學出版社
- ISBN:9787302628309
- 定價:49 元
內容簡介,圖書目錄,
內容簡介
基於大數據時代生物醫學數據的爆炸式增長,本書從醫學科研中的實際問題出發,以案例的形式深入淺出地介紹醫學數據挖掘技術,包括決策樹模型、支持向量機、隨機森林分類、關聯規則、貝葉斯網路構建等,並詳細介紹數據挖掘軟體(SPSS、SAS和R等)的操作步驟,重點突出實用性和可操作性,以期提高讀者對醫學科研數據的深層次處理與分析的能力。
圖書目錄
目錄
第1章 數據預處理 1
1.1 異常值的常見處理方法 1
1.2 缺失值填補的SPSS軟體實現 8
1.3 缺失值填補的R軟體實現 12
第2章 多元線性回歸分析 17
2.1 多元線性回歸的概念 17
2.2 多元線性回歸的模型結構 17
2.3 多元逐步線性回歸 20
第3章 Logistic回歸分析 25
3.1 Logistic回歸分析的基本概念 25
3.2 Logistic回歸的模型結構 25
3.3 套用實例1:一般資料的Logistic回歸 26
3.4 套用實例2:列聯表資料的Logistic回歸 29
3.5 套用實例3:多項Logistic回歸分析 31
3.6 Logistic回歸模型的Nomogram圖展示 34
3.7 多個Logistic回歸模型評價的決策曲線分析法 38
第4章 非線性回歸擬合分析 43
4.1 非線性回歸基本概念 43
4.2 套用實例1:對新增SARS病例數的預測分析 43
4.3 套用實例2:對累計SARS病例數的預測分析 48
第5章 生存分析 52
5.1 生存分析的基本概念 52
5.2 生存分析的資料特點 52
5.3 生存資料的分析方法 53
5.4 套用實例1:累積生存率的計算 53
5.5 套用實例2:小樣本生存率的Kaplan-Meier估計 56
5.6 套用實例3:生存曲線比較的Log-rank檢驗 59
5.7 套用實例4:Cox回歸 63
5.7.1 Cox模型結構與參數估計 64
5.7.2 套用實例:Cox回歸分析 64
5.7.3 Cox回歸的諾莫圖繪製 67
第6章 基於競爭風險模型的生存分析 71
6.1 競爭風險模型 71
6.2 套用實例:競爭風險模型的生存分析 71
第7章 Meta分析 77
7.1 Meta分析概述 77
7.2 Meta分析的方法與步驟 77
7.3 套用實例1:二分類資料的Meta分析 78
7.4 套用實例2:連續資料的Meta分析 86
第8章 劑量-反應模型的Meta分析 91
8.1 劑量-反應關係的數據結構 91
8.2 線性擬合 92
8.3 非線性擬合-三次曲線擬合 94
第9章 決策樹模型分析 96
9.1 分類的概念 96
9.2 分類的步驟 96
9.3 分類器性能的評估 97
9.4 決策樹分類器簡介 97
9.5 套用實例:決策樹分類分析 99
9.6 套用實例:決策樹回歸分析 102
第10章 隨機森林法提取特徵屬性 105
10.1 隨機森林方法基本概念 105
10.2 基於平均基尼指數減少量的特徵屬性選擇 105
10.3 套用實例:隨機森林法提取特徵屬性 107
第11章 傾向性得分匹配方法 113
11.1 傾向性得分匹配方法概述 113
11.2 傾向性得分匹配方法的步驟 113
11.3 套用實例:傾向性得分匹配 114
第12章 用廣義估計方程分析重複測量的定性資料 121
12.1 廣義估計方程的基本概念 121
12.2 廣義線性模型的結構 121
12.3 GEE算法 122
12.4 套用實例1:重複測量的實驗數據 123
12.5 套用實例2:問卷調查中的復選題數據 124
第13章 基於支持向量機的微陣列數據分類 128
13.1 支持向量機簡介 128
13.2 支持向量機的基本原理 128
13.3 套用實例:支持向量機分類 130
第14章 時間序列分析 132
14.1 時間序列分析的基本概念 132
14.2 時間序列分析的主要步驟 132
14.3 套用實例:時間序列分析 133
第15章 路徑圖分析 138
15.1 路徑圖分析基本理論 138
15.2 路徑圖分析的基本步驟 138
15.3 套用實例:路徑圖分析 139
15.3.1 第一個回歸分析 139
15.3.2 第二個回歸分析 141
15.3.3 第三個回歸分析 142
第16章 主成分分析與因子分析 144
16.1 主成分分析概念 144
16.2 套用實例1:主成分分析 144
16.3 因子分析概念 151
16.4 套用實例2:因子分析 151
第17章 判別分析 156
17.1 判別分析的概念 156
17.2 常用的判別分析方法 156
17.3 判別函式的驗證 157
17.4 套用實例:判別分析 157
第18章 聚類分析 166
18.1 聚類分析的概念 166
18.2 K均值聚類法 166
18.3 套用實例1:K均值聚類及可視化 167
18.4 系統聚類法 170
18.5 套用實例2:系統聚類 172
18.6 繪製雙向聚類熱圖 177
第19章 關聯規則 180
19.1 關聯規則的基本概念 180
19.2 關聯規則的質量和重要性 180
19.3 關聯規則分析的基本方法 181
19.4 套用實例:關聯規則分析 181
第20章 兩組ROC曲線下的面積比較 185
20.1 ROC曲線的構建 185
20.2 ROC曲線下面積 186
20.3 兩組ROC曲線下面積比較 186
20.4 套用實例:兩組ROC曲線下面積比較 186
20.5 偏AUC分析 189
第21章 診斷準確性試驗Meta分析 193
21.1 診斷準確性試驗Meta分析基本概念 193
21.2 診斷準確性試驗Meta分析的相關評價指標 193
21.3 套用實例:診斷準確性試驗Meta分析 194
第22章 網路Meta分析 199
22.1 網路Meta分析的概念 199
22.2 基於經典頻率派方法的網路Meta分析 200
22.3 基於貝葉斯方法的網路Meta分析 207
第23章 貝葉斯網路分析 216
23.1 貝葉斯網路的概念 216
23.2 套用實例:貝葉斯網路構建 217
第24章 偏最小二乘回歸與判別分析 222
24.1 偏最小二乘回歸的基本步驟和原理 222
24.2 套用實例:偏最小二乘回歸分析 223
24.3 偏最小二乘判別分析 226
第25章 Lasso回歸分析 233
25.1 基於Lasso方法的線性回歸模型 234
25.2 基於Lasso方法的Logistic回歸模型 237
25.3 基於Lasso方法的Cox回歸模型 241
參考文獻 244