內容簡介
本書內容涉及R與SAS軟體基礎知識及醫學科研設計中關鍵技術、定性與定量資料廣義差異性分析、變數間相關與回歸分析、判別分析與聚類分析的軟體實現。全書基於經典統計、貝葉斯統計、蒙特卡羅統計和機器學習與深度學習等統計思想來介紹統計學理論及方法,基於R與SAS兩種各具特色且優勢互補的統計軟體來實現統計計算,再通過大量實例來演示如何正確、方便且高效地解決包括科研設計與統計分析在內的各種實際問題。
圖書目錄
第1篇 R與SAS軟體基礎知識
第1章 R軟體概述 3
1.1 R軟體的歷史 3
1.2 R軟體的功能 3
1.3 R軟體的獲取 3
1.4 R軟體的界面 5
1.5 R軟體包中的函式 7
1.6 R軟體的工作目錄及改變工作目錄 12
1.7 使用R軟體的幫助功能 13
第2章 在R軟體環境中輸入和輸出數據 14
2.1 通過R軟體或RStudio軟體提供的控制台輸入和輸出數據 14
2.2 在R軟體環境中以文本格式輸入和輸出數據 17
2.3 在R軟體環境中以Excel格式輸入和輸出數據 18
2.4 在R軟體環境中以SAS格式輸入和輸出數據 21
2.5 在R軟體環境中以SPSS格式輸入和輸出數據 25
2.6 在R軟體環境中以Stata格式輸入和輸出數據 26
2.7 在R軟體環境中以R格式輸入和輸出數據 27
第3章 R語言簡介 31
3.1 R語言概述 31
3.2 R語法 32
3.3 R對象 41
3.4 函式 62
第4章 SAS軟體概述 72
4.1 SAS軟體的歷史與規模 72
4.2 SAS軟體的框架與結構 72
4.3 SAS環境與SAS視窗 73
4.4 發揮SAS幫助功能的作用 74
4.5 SAS過程與SAS程式的區別 74
4.6 SAS數據步與SAS過程步簡介 75
4.7 SAS數據集與其他格式的數據簡介 76
第5章 在SAS軟體環境中輸入和輸出數據 80
5.1 概述 80
5.2 導入/導出嚮導 80
5.3 IMPORT和EXPORT過程 88
5.4 數據直接訪問 92
第6章 基本SAS語言簡介 95
6.1 SAS程式 95
6.2 SAS語句的概念 96
6.3 數據步常用語句 100
6.4 過程步常用語句 140
6.5 全程語句 143
第7章 SAS常用函式簡介 147
7.1 截取函式 147
7.2 分位數函式 149
7.3 數學函式 152
7.4 機率函式 156
7.5 樣本統計函式 160
7.6 隨機數函式 163
第2篇 醫學科研設計中關鍵技術的軟體實現
第8章 醫學科研設計要覽 171
8.1 醫學課題研究概述 171
8.2 醫學科研設計方案的種類及主要內容 172
8.3 醫學倫理道德 175
8.4 國際註冊 176
8.5 硬體和軟體條件 176
8.6 醫學科研課題技術設計方案中的核心內容 177
第9章 估計樣本含量與檢驗效能 184
9.1 估計樣本含量與檢驗效能的概述 184
9.2 定量資料假設檢驗時估計樣本含量與檢驗效能 185
9.3 定性資料假設檢驗時估計樣本含量與檢驗效能 193
第10章 產生隨機數與隨機抽樣 197
10.1 產生隨機數 197
10.2 隨機抽樣 204
第11章 隨機分組與統計模擬 214
11.1 隨機分組 214
11.2 統計模擬 219
第3篇 定性資料廣義差異性分析的軟體實現
第12章 單組設計一元定性資料區間估計與假設檢驗 235
12.1 問題與數據 235
12.2 對數據結構的分析 235
12.3 分析目的與統計分析方法的選擇 235
12.4 基於R的單個率的假設檢驗與區間估計 235
12.5 基於SAS的單個率的假設檢驗與區間估計 239
第13章 2×2列聯表資料廣義差異性分析 244
13.1 配對設計四格表資料的多種診斷指標的計算 244
13.2 配對設計四格表資料的一致性與對稱性檢驗 247
13.3 橫斷面設計2×2表資料差異性分析 249
13.4 佇列研究設計2×2表資料差異性分析 251
13.5 病例對照研究設計2×2表資料差異性分析 253
13.6 橫斷面設計2×2表資料非劣效性分析 254
13.7 橫斷面設計2×2表資料等效性分析 255
13.8 橫斷面設計2×2表資料優效性分析 256
第14章 R×2列聯表與2×C列聯表資料線性趨勢檢驗 258
14.1 R×2列聯表資料線性趨勢檢驗 258
14.2 2×C列聯表資料線性趨勢檢驗 261
第15章 R×C列聯表資料廣義差異性分析 265
15.1 橫斷面設計雙向無序R×C列聯表資料差異性分析 265
15.2 橫斷面設計結果變數為有序變數單向有序R×C列聯表資料秩和檢驗 266
15.3 橫斷面設計雙向有序且屬性不同R×C列聯表資料Spearman秩相關分析 268
15.4 配對設計擴大形式雙向有序且屬性相同列聯表資料一致性分析 271
15.5 配對設計擴大形式雙向有序且屬性相同列聯表資料Kendall’s tau-b秩相關分析 273
第16章 高維列聯表資料廣義差異性分析 276
16.1 結果變數為二值變數高維列聯表資料CMH校正χ2檢驗 276
16.2 結果變數為多值名義變數高維列聯表資料CMH校正χ2檢驗 280
16.3 結果變數為多值有序變數高維列聯表資料CMH校正秩和檢驗 283
第4篇 定量資料廣義差異性分析的軟體實現
第17章 定量資料參數假設檢驗前提條件的檢查 289
17.1 單組設計一元定量資料小樣本正態性檢驗 289
17.2 單組設計一元定量資料大樣本正態性檢驗 290
17.3 單因素兩水平設計一元定量資料方差齊性檢驗 292
17.4 單因素多水平設計一元定量資料方差齊性檢驗 294
第18章 單因素設計一元定量資料廣義差異性分析 297
18.1 單組設計一元定量資料t檢驗及符號秩和檢驗 297
18.2 配對設計一元定量資料t檢驗與符號秩和檢驗 298
18.3 成組設計一元定量資料差異性檢驗——t檢驗及秩和檢驗 300
18.4 成組設計一元定量資料非劣效性檢驗 302
18.5 成組設計一元定量資料等效性檢驗 303
18.6 成組設計一元定量資料優效性檢驗 304
18.7 單因素多水平設計一元定量資料方差分析及秩和檢驗 306
18.8 多個均值之間的兩兩比較 309
第19章 無法考察互動作用的多因素設計一元定量資料方差分析 312
19.1 無重複試驗隨機區組設計一元定量資料方差分析 312
19.2 交叉設計一元定量資料方差分析 319
19.3 拉丁方設計一元定量資料方差分析 321
19.4 嵌套設計一元定量資料方差分析 323
第20章 考察全部互動作用的多因素設計一元定量資料方差分析 330
20.1 兩因素析因設計一元定量資料方差分析 330
20.2 三因素析因設計一元定量資料方差分析 335
第21章 考察部分互動作用的多因素設計一元定量資料方差分析 339
21.1 正交設計一元定量資料方差分析 339
21.2 裂區設計一元定量資料方差分析 347
21.3 重複測量設計一元定量資料方差分析 350
第5篇 變數間相關與回歸分析的軟體實現
第22章 兩變數間簡單線性相關分析 363
22.1 問題、數據及統計分析方法的選擇 363
22.2 Pearson線性相關分析 366
22.3 Spearman秩相關分析 367
第23章 兩變數間簡單線性回歸分析 370
23.1 問題、數據及統計分析方法的選擇 370
23.2 簡單線性回歸分析 370
第24章 兩變數間簡單曲線回歸分析 373
24.1 問題與數據 373
24.2 分析與解答 374
第25章 多重線性回歸分析核心內容與關鍵技術概述 384
25.1 與多重線性回歸分析有關的基本概念 384
25.2 構建多重線性回歸分析模型的方法 390
25.3 多重線性回歸分析模型的假設檢驗 393
25.4 實施多重線性回歸分析的重要步驟與關鍵技術 394
25.5 多重線性回歸分析模型擬合效果的評價 398
第26章 基於經典統計思想實現多重線性回歸分析 400
26.1 未引入派生變數並採用經典統計思想實現多重線性回歸分析 400
26.2 引入派生變數並採用經典統計思想實現多重線性回歸分析 414
26.3 基於主成分回歸分析與嶺回歸分析實現多重線性回歸分析 424
第27章 基於貝葉斯統計思想實現多重線性回歸分析 428
27.1 MCMC方法概述 428
27.2 未引入派生變數且基於貝葉斯統計思想實現多重線性回歸分析 429
27.3 引入派生變數且基於貝葉斯統計思想實現多重線性回歸分析 433
第28章 基於機器學習統計思想實現多重線性回歸分析 436
28.1 機器學習回歸分析方法概述 436
28.2 未引入派生變數且基於BP神經網路回歸分析建模 437
第29章 基於經典統計思想實現二值因變數的多重logistic回歸分析 441
29.1 二值因變數的多重logistic回歸模型的建模與求解 441
29.2 問題與數據結構 443
29.3 二值因變數的多重logistic回歸分析 446
29.4 基於SAS實現ROC曲線下面積計算與比較 454
第30章 基於經典統計思想實現多值有序因變數的多重logistic回歸分析 463
30.1 多值有序因變數的多重logistic回歸模型的建模與求解 463
30.2 問題與數據結構 465
30.3 多值有序因變數的多重logistic回歸分析 467
第31章 生存資料非參數統計分析 474
31.1 概述 474
31.2 問題與數據結構 477
31.3 單因素一元生存資料非參數統計分析 478
第32章 生存資料Cox比例風險模型回歸分析 483
32.1 概述 483
32.2 問題與數據結構 484
32.3 基於SAS的生存資料Cox比例風險模型回歸分析 487
32.4 基於R的生存資料Cox比例風險模型回歸分析 490
第33章 Cox非比例風險模型回歸分析 494
33.1 概述 494
33.2 問題與數據結構 494
33.3 基於SAS的生存資料Cox比例風險模型回歸分析 495
第34章 生存資料的參數模型回歸分析 507
34.1 概述 507
34.2 問題與數據結構 508
34.3 基於SAS的生存資料參數模型回歸分析的準備 508
34.4 未引入派生變數且基於SAS的生存資料參數模型回歸分析 509
34.5 引入派生變數且基於SAS的生存資料參數模型回歸分析 517
34.6 最優模型的判定 524
34.7 基於R實現生存資料參數模型回歸分析 525
第6篇 判別分析與聚類分析的軟體實現
第35章 基於R軟體採用支持向量機方法實現判別分析 531
35.1 三類別資料及其分類問題 531
35.2 支持向量機方法的實現 533
35.3 用支持向量機方法進行判別分析 534
35.4 用支持向量機方法進行判別分析的R程式匯總 540
第36章 基於標準化變換的求和法實現無序樣品聚類分析 543
36.1 概述 543
36.2 基於標準化變換的求和法 544
36.3 綜合評價質量的判定標準 546
36.4 標準化變換的求和法的套用實例1 547
36.5 標準化變換的求和法的套用實例2 551
參考文獻 554
附錄