內容簡介
SPSS 是世界公認的標準統計軟體之一。由於其易學易用,深受廣大用戶,特別是非統計學專業人員的青睞。本書共27 章,分基礎篇和高級篇兩部分,基礎篇介紹了SPSS 的基本知識和常用統計學方法;高級篇囊括了大量現代統計學分析方法,如決策樹分析、多項分類logistic 回歸、Poisson回歸、
神經網路模型、廣義估計方程、ROC 分析、典型相關分析、重複測量資料分析、混合效應模型分析、時間序列分析、信度分析、結合分析、對應分析等。
本書編寫特色在於:首先儘可能通俗易懂地介紹統計學方法,然後藉助於SPSS 軟體實現這些方法,對於SPSS 運行後所輸出的結果給予合理的、詳盡的解釋。本書特別注重統計學方法的介紹,以及軟體輸出結果的解釋。本書在附帶光碟中提供了100 余個實例數據,可供讀者調用、練習。
圖書目錄
方案,供讀者選擇統計學分析方法時參考。
目 錄
基 礎 篇
第1 章 概 述 2
1.1 SPSS 簡介 2
1.2 使用SPSS 進行數據分析的基本步驟 3
1.3 主要視窗和功能 3
1.3.1 數據編輯視窗 4
1.3.2 結果瀏覽視窗 6
1.3.3 程式編輯視窗 13
1.4 通過數據編輯視窗輸入數據 14
1.4.1 使用數據視窗輸入數據 14
1.4.2 定義變數 15
1.4.3 數據輸入實例 20
1.5 SPSS 數據檔案的存取 24
1.5.1 存取保存的SPSS 檔案 24
1.5.2 讀取保存的數據檔案 25
1.5.3 讀取Excel 電子表格數據檔案 25
1.5.4 讀取Access 資料庫(ODBC 數據接口) 26
1.5.5 保存SPSS 數據檔案 29
1.6 數據的編輯與整理 30
1.6.1 發現重複數據 30
1.6.2 選擇數據 32
1.6.3 定義權重 35
1.6.4 數據排序 36
1.6.5 數據轉置 37
1.6.6 數據合併 38
1.6.7 數據拆分 40
1.6.8 數據匯總 41
1.6.9 查找數據 43
1.7 數據轉換 45
1.7.1 公式計算 45
1.7.2 數據編碼 48
1.7.3 替代缺失數據 50
1.7.4 數據例編秩 51
1.7.5 頻數分組 53
1.8 幫助的獲取 53
1.8.1 按專題組織的幫助 53
1.8.2 通過對話框內的Help 按鈕使用幫助 54
1.8.3 使用統計教練 54
1.8.4 使用在線上幫助和網路討論組 54
第2 章 數據類型與統計學描述 55
2.1 數據分類 55
2.2 製作頻數表 56
2.2.1 區間數據頻數分段 56
2.2.2 用Frequencies 編制頻數表 62
2.3 用Descriptives 進行區間數據的統計描述 67
2.3.1 操作過程 67
2.3.2 結果解釋 68
2.4 用Explore 進行區間數據的統計描述 69
2.4.1 操作過程 70
2.4.2 結果解釋 72
2.5 用Bivariate 進行變數間的相關與
協方差分析 76
2.5.1 操作過程 76
2.5.2 結果解釋 77
2.6 名義數據的統計描述 80
2.6.1 單個名義變數的描述分析 80
2.6.2 多指標的描述分析 82
第3 章 機率分布與正態性檢驗 87
3.1 機率分布 87
3.1.1 常態分配 87
3.1.2 二項分布 90
3.1.3 Poisson 分布 94
3.2 抽樣分布 96
3.2.1 t 分布 96
3.2.2 2 分布 98
3.2.3 F 分布 100
3.3 正態性檢驗 101
3.3.1 P-P 圖法 102
3.3.2 Q-Q 圖法 104
3.3.3 直方圖、箱式圖與莖葉圖 105
3.3.4 計算法 111
第4 章 區間估計與假設檢驗 114
4.1 均數的區間估計 114
4.1.1 已知時總體均數的置信區間 115
4.1.2 未知時總體均數的置信區間 116
4.1.3 兩總體均數間差值的置信區間 118
4.2 總體方差、總體標準差的置信區間 120
4.3 率的區間估計 121
4.3.1 總體率的置信區間 121
4.3.2 兩總體率差值的置信區間 121
4.4 假設檢驗與兩類錯誤 121
4.4.1 假設檢驗的概念與原理 122
4.4.2 假設檢驗的兩類錯誤 123
4.4.3 假設檢驗的基本步驟 124
4.5 樣本含量的估計與檢驗效能 125
4.5.1 影響樣本量大小的因素 125
4.5.2 總體均數區間估計的樣本含量 126
4.5.3 樣本均數與總體均數比較樣本含量估計 126
4.5.4 完全隨機設計兩樣本均數比較的樣本含量估計 127
4.5.5 完全隨機設計多個樣本均數比較的樣本含量估計 128
4.5.6 估計總體率時的樣本含量估計 129
4.5.7 樣本率與總體率比較的樣本含量估計 129
4.5.8 兩樣本率比較的樣本含量估計 130
4.5.9 多個樣本率比較的樣本含量估計 130
4.5.10 直線相關分析的樣本含量估計 131
4.5.11 檢驗效能 131
第5 章 區間數據的統計推斷 134
5.1 t 檢驗 134
5.1.1 單個總體均數的t 檢驗 134
5.1.2 獨立樣本成組t 檢驗 136
5.1.3 成對樣本t 檢驗 138
5.2.1 兩組資料的單因素方差分析 140
5.2.2 多組資料的單因素方差分析 140
5.3.1 基本分析步驟 142
5.3.2 關於Univariate 過程對話框的說明 145
5.4 對比與事後檢驗 148
5.4.1 對比 148
5.4.2 事後檢驗 150
5.4.3 Bootstrap 153
5.5 方差齊性檢驗 155
第6 章 名義分類數據的統計推斷 157
6.1 四格表數據的卡方檢驗 157
6.1.1 一般四格表卡方檢驗 157
6.1.2 連續性校正卡方檢驗 165
6.2 R×C 無序列聯表的卡方檢驗 169
6.2.1 多個樣本率的卡方檢驗 169
6.2.2 多個樣本構成的卡方檢驗 171
6.3 Fisher’s 精確檢驗 173
6.3.1 四格表的精確機率法 173
6.3.2 RC 列聯表精確機率 175
第7 章 有序數據的統計推斷 179
7.1 R×C 單向有序列聯表的檢驗 179
7.1.1 Wilcoxon 秩和檢驗 179
7.1.2 趨勢檢驗182
7.1.3 Kruskal-Wallis 檢驗 184
7.1.4 實例與操作 185
7.2 雙向有序列聯表的檢驗 187
7.2.1 Spearman 等級相關 187
7.2.2 Jonckheere-Terpstra 檢驗 189
7.2.3 Cochran-Mantel-Haenszel 統計分析 191
7.3.1 2 相關樣本的秩檢驗 194
7.3.2 多組相關樣本檢驗 198
第8 章 簡單線性回歸與相關 201
8.1 一般的簡單線性回歸 201
8.1.1 線性回歸的概念 201
8.1.2 建立線性回歸方程 202
8.1.3 回歸係數的假設檢驗 203
8.1.4 實例與操作 204
8.2 加權的簡單線性回歸 213
8.2.1 加權最小二乘估計 214
8.2.3 實例與操作 215
8.3 簡單線性相關 218
8.3.1 概念 218
8.3.2 線性相關係數的意義和計算 219
8.3.3 相關係數的假設檢驗 219
8.3.4 實例與操作 220
第9 章 曲線回歸與非線性回歸 224
9.1 曲線直線化變換方法 224
9.1.1 變數的變換 224
9.1.2 變數變換後實現線性回歸的步驟 225
9.1.3 實例與操作 225
9.2 曲線回歸 227
9.2.1 一般步驟 227
9.2.2 SPSS 操作提示 228
9.2.3 實例與操作 230
9.3.1 基本原理 233
9.3.2 SPSS 操作提示 233
9.3.3 實例與操作 237
第10 章 多重線性回歸與相關 241
10.1 多項式回歸 241
10.2 多重回歸分析方法 242
10.2.1 多重回歸模型 242
10.2.2 參數估計 242
10.2.3 回歸方程的假設檢驗與擬合優度評價 243
10.2.4 自變數的選擇 243
10.2.5 SPSS 操作提示 244
10.2.6 實例與操作 247
10.3 共線性解決方案與校正 252
10.3.1 多重共線性的診斷 252
10.3.2 共線性解決方案 253
10.4 殘差分析與回歸診斷 254
10.5 互動作用與啞變數問題 254
10.5.1 互動作用 254
10.5.2 啞變數的設定 255
10.6.1 復相關係數、決定係數與調整決定係數 257
10.6.2 偏相關係數 257
第11 章 統計圖的製作 261
11.1 條圖 262
11.2 3-D 條圖 268
11.3 線圖 269
11.4 面積圖 273
11.5 圓圖 274
11.6 高低圖 275
11.7 帕累托圖 277
11.8 質量控制圖 279
11.9 箱圖 282
11.10 誤差條圖 284
11.11 分群金字塔圖 286
11.12 散點圖 287
11.13 直方圖 291
11.14 P-P 機率圖 292
11.15 Q-Q 機率圖 294
11.16 序列圖 295
11.17 統計圖形的編輯加工 297
11.17.1 圖形編輯視窗簡介 297
11.17.2 圖形特徵的編輯 298
11.17.3 坐標軸編輯 304
11.17.4 圖例的編輯 306
11.17.5 添加和顯示/隱藏圖形元素 306
第12 章 診斷試驗評價與ROC 分析 308
12.1 常用的診斷試驗評價指標 308
12.1.1 正確率 309
12.1.2 靈敏度 309
12.1.3 特異度 310
12.1.4 Youden 指數 311
12.1.6 陰性似然比 312
12.1.7 陽性預測價值 312
12.1.8 陰性預測價值 313
12.1.9 優勢比及其有關指標 314
12.1.10 Kappa 316
12.2 ROC 曲線 317
12.2.1 ROC 分析的基本原理 318
12.2.2 SPSS 操作說明 320
12.2.3 實例與結果解釋 322
第13 章 缺失值分析 331
13.1 缺失值分析簡介 331
13.1.1 基本概念 331
13.1.2 缺失機制 332
13.1.3 缺失值的常用處理方法 335
13.2 SPSS 操作提示 340
13.2.1 SPSS 的缺失值處理方法 340
13.2.2 缺失值處理的SPSS 操作 341
13.3 結果解釋 345
高 級 篇
第14 章 logistic 回歸 356
14.1 二項分類logistic 回歸 356
14.1.1 方法介紹 357
14.1.2 SPSS 操作選項說明 366
14.1.3 實例與結果解釋 371
14.2 條件logistic 回歸 386
14.2.1 方法介紹 386
14.2.2 SPSS 操作選項說明 387
14.2.3 實例與結果解釋 387
14.3 有序logistic 回歸 393
14.3.1 方法介紹 393
14.3.2 SPSS 操作選項說明 395
14.3.3 實例與結果解釋 398
14.4 多項分類logistic 回歸 404
14.4.1 方法介紹 404
14.4.2 SPSS 操作選項說明 406
14.4.3 實例與結果解釋 409
第15 章 對數線性模型與Poisson 回歸 414
15.1 列聯表的對數線性模型 414
15.1.1 方法介紹 414
15.1.2 實例與操作 416
15.2 Poisson 回歸 430
15.2.1 基本原理 430
15.2.2 實例與操作 431
第16 章 生存分析與Cox 模型 435
16.1 常用術語 435
16.2 非參數分析 437
16.2.1 壽命表法 437
16.2.2 Kaplan-Meier 法 442
16.3 Cox 回歸模型447
16.3.1 方法介紹 447
16.3.2 實例與操作 449
16.4 時間依存變數的處理方法 455
16.4.1 時間依存變數Cox 模型 455
16.4.2 Cox w/Time-Dep Cov 過程操作說明 457
第17 章 聚類、判別與決策樹分析 460
17.1 概述 460
17.1.1 聚類分析基礎知識 460
17.1.2 判別分析基礎知識 461
17.1.3 SPSS 聚類和判別分析模組 463
17.2 聚類分析 463
17.2.1 二階段聚類 463
17.2.2 K 中心聚類 468
17.2.3 層次聚類 470
17.3 判別分析 474
17.4 決策樹分析 481
17.4.1 基本原理 481
17.4.2 決策樹 490
17.4.3 操作提示 491
17.4.4 結果解釋 492
第18 章 主成分分析與因子分析 496
18.1 主成分分析 496
18.1.1 概述 496
18.1.2 實例與操作 498
18.2 因子分析 511
18.2.1 概述 511
18.2.2 實例與操作 512
18.3 主成分分析與因子分析的聯繫及區別 518
第19 章 多因素方差分析 520
19.1.1 概述 520
19.1.2 實例與操作 521
19.2 析因設計及其方差分析 525
19.2.1 概述 525
19.2.2 實例與操作 525
19.3 嵌套設計及其方差分析 528
19.3.1 概述 528
19.3.2 實例與操作 528
19.4 交叉設計及其方差分析 530
19.4.1 概述 530
19.4.2 實例與操作 530
第20 章 重複測量與混合效應模型 533
20.1 重複測量方差分析 533
20.1.2 重複測量設計臨床試驗數據 546
20.2 線性混合效應模型 549
20.2.1 分層隨機抽樣調查數據的混合效應模型分析 549
20.2.2 重複測量數據的混合效應模型分析 555
第21 章 多變數方差分析 560
21.1.1 單樣本分析 561
21.1.2 兩樣本單因素設計資料 564
21.2 多因素資料的多元方差分析 566
21.2.1 兩因素設計 566
21.2.2 配對設計資料的多元方差分析 574
21.2.3 重複測量設計資料的多元方差分析 576
21.3 典型相關分析 577
第22 章 廣義線性模型 583
22.1 概述 583
22.1.1 模型的組成 583
22.1.2 常見的幾種廣義線性模型 585
22.1.3 廣義線性模型的三種估計方程及參數估計 585
22.1.4 模型診斷 585
22.2 logistic 回歸 586
22.3 Poisson 對數線性模型 594
第23 章 廣義估計方程 600
23.1 概述 600
23.1.1 廣義估計方程的基本理論 600
23.1.2 作業相關矩陣 602
23.1.3 廣義估計方程的套用 603
23.2 實例與操作 604
23.2.1 數據的一般情況 604
23.2.2 SPSS 操作提示與選項說明 604
23.2.3 SPSS 輸出結果及其解釋 609
第24 章 對應分析與結合分析 613
24.1 對應分析 613
24.1.1 方法介紹 613
24.1.2 SPSS 操作選項說明 616
24.1.3 實例分析 617
24.1.4 多重對應分析 620
24.2 結合分析 620
24.2.1 方法介紹 620
24.2.2 SPSS 操作選項說明 625
24.2.3 實例分析 625
第25 章 信度分析 630
25.1 重複測量法與分半信度法 631
25.1.1 方法介紹 631
25.1.2 實例與操作 632
25.2 Cronbach α 係數 635
25.2.1 方法介紹 635
25.2.2 SPSS 操作選項說明 635
25.2.3 實例描述 637
25.3 Kappa 係數 638
25.3.1 方法介紹 638
25.3.2 實例描述 639
25.3.3 操作選項說明 640
25.3.4 結果解釋 641
25.4 Kendall 和諧係數 642
25.4.1 方法介紹 642
25.4.2 實例描述 642
25.4.3 SPSS 操作選項說明 643
25.4.4 主要結果 644
第26 章 時間序列分析 645
26.1 概述 645
26.1.1 時間序列數據及其分析方法 645
26.1.2 時間序列分析的模型、公式和記號 646
26.1.3 SPSS 時間序列分析功能 650
26.2 時間序列數據的預處理 651
26.2.1 定義日期變數 651
26.2.2 創建時間序列 653
26.2.3 填補缺失數據 658
26.3.1 指數平滑法的原理 660
26.3.2 指數平滑法的操作 662
26.4 ARIMA 模型 667
26.4.1 概述 667
26.4.2 ARIMA 模型識別、建模和模型評價、預測 668
26.4.3 帶有季節因子的ARIMA 模型 679
26.5 季節性結構分量模型 680
26.5.1 概述 680
26.5.2 分析實例 681
27.1 概述 684
27.1.1 模型的組成 684
27.1.2 神經網路的數據樣本 686
27.1.3 神經網路的種類 686
27.2.1 概述 687
27.2.2 實例與操作 687
27.3 徑向基函式神經網路模型 701
27.3.1 概述 701
27.3.2 實例與操作 701
附錄A SPSS 函式 710
附錄B SPSS 統計分析程式簡介 717
附錄C 統計分析方法路徑圖 728
參考文獻 732