SPSS統計分析與數據挖掘(第3版)

基本介紹

  • 書名:SPSS統計分析與數據挖掘(第3版)
  • 作者:謝龍漢,蔡思祺
  • ISBN:9787121329074
  • 頁數:508頁
  • 出版時間:2017-11
  • 開本:16開
基本信息,內容簡介,目錄信息,

基本信息

SPSS統計分析與數據挖掘(第3版)
叢書名 :工程設計與分析系列
作 譯 者:謝龍漢,蔡思祺
出版時間:2017-11
千 字 數:812
版 次:01-01
頁 數:508
開 本:16開
I S B N :9787121329074

內容簡介

本書基於SPSS 24.0編寫,在修正並完善第2版的基礎上完成的;每章均有大量分析案例,結合案例對SPSS各模組的統計分析功能和圖形功能進行詳細講解。本書具體內容為SPSS簡介、SPSS數據挖掘系統介紹、數據檔案管理、數據預處理、基本統計分析、多重反應分析、均值的比較與檢驗、統計圖製作、參數檢驗、回歸分析、方差分析、相關分析、聚類分析、判別分析、因子分析、對應分析、信度分析、生存分析、對數線性模型、時間序列分析、缺失值分析,以及SPSS在財務智慧型、數據預測、股市分析、社會經濟分析、金融數據分析等方面的數據挖掘套用。 本書最大特點是拋棄了其他同類書籍中只介紹理論用法、缺乏案例分析的弊端,全書給出大量數據挖掘分析案例,並配有視頻講解,為讀者展示SPSS在數據分析、信用風險管理、直銷分析、社會經濟分析等實際項目中的套用。

目錄信息

第1章 SPSS軟體概述 1
1.1 SPSS簡介 1
1.2 SPSS操作入門 2
1.2.1 軟體安裝、啟動及退出 3
1.2.2 操作環境 4
1.2.3 系統參數的設定 7
1.3 SPSS的幫助系統 15
第2章 SPSS數據挖掘系統 17
2.1 數據挖掘概述 17
2.1.1 數據挖掘的含義 17
2.1.2 數據挖掘與OLAP 18
2.1.3 數據挖掘和統計學 18
2.1.4 數據挖掘的目的 19
2.1.5 數據挖掘套用 19
2.1.6 數據挖掘流程 19
2.2 成功的數據挖掘 20
2.2.1 CRISP-DM方法論 21
2.2.2 選擇數據挖掘工具 25
2.2.3 SPSS數據挖掘 26
2.3 SPSS數據挖掘的過程 29
2.3.1 商業理解 29
2.3.2 數據理解 29
2.3.3 數據準備 29
2.3.4 數據模型 30
2.3.5 評估 30
2.3.6 部署 31
第3章 數據檔案、變數與函式 33
3.1 SPSS的變數類型 33
3.1.1 數據的輸入 34
3.1.2 變數的編輯 35
3.2 數據檔案的打開和保存 36
3.2.1 打開SPSS數據檔案 37
3.2.2 打開其他格式的數據檔案 37
3.2.3 數據檔案保存 38
3.3 SPSS函式 38
3.3.1 算術函式 39
3.3.2 統計函式 39
3.3.3 邏輯函式 40
3.3.4 日期和時間函式 40
3.3.5 隨機變數函式 42
3.3.6 反分布函式 43
3.3.7 累計分布函式 44
3.3.8 缺失值函式 46
3.3.9 字元串函式 47
第4章 數據預處理 49
4.1 數據檔案的整理 49
4.1.1 個案排序(Sort Case)過程50
4.1.2 轉置(Transpose)過程 50
4.1.3 合併檔案(Merge File)過程51
4.1.4 匯總(Aggregate)過程 53
4.1.5 拆分檔案(Split File)過程55
4.1.6 選擇個案(Select Cases)過程 55
4.1.7 個案加權(Weight Cases)過程 56
4.2 數據變數的變換和計算 56
4.2.1 計算變數(Compute
Variables)過程 57
4.2.2 計數(Count)過程 59
4.2.3 重新編碼(Recode)過程 60
4.2.4 個案排秩(Rank Cases)
過程 61
4.2.5 自動重新編碼(Automatic Recode)過程 63
第5章 基本統計分析 65
5.1 基本概念 65
5.1.1 基本的統計概念 65
5.1.2 描述性統計分析 67
5.2 頻率分析 68
5.2.1 頻率分析過程的操作界面 68
5.2.2 實例分析 70
5.3 描述性統計分析過程 72
5.3.1 描述性統計分析過程參數設定 72
5.3.2 實例分析 72
5.4 數據探索性分析過程 74
5.4.1 數據探索性分析過程參數設定 74
5.4.2 實例分析 75
5.5 交叉表分析過程 78
5.5.1 交叉表過程的參數設定 78
5.5.2 實例分析 81
第6章 參數檢驗 84
6.1 參數估計和假設檢驗概述 84
6.1.1 參數估計 84
6.1.2 假設檢驗 87
6.2 平均值(Means)過程 92
6.2.1 SPSS的平均值過程參數的設定 92
6.2.2 平均值過程實例 93
6.3 單樣本t檢驗 94
6.3.1 單樣本t檢驗過程的參數設定 94
6.3.2 實例分析 95
6.4 獨立樣本t檢驗 97
6.4.1 獨立樣本t檢驗過程的參數設定 97
6.4.2 實例分析 98
6.5 成對樣本t檢驗 100
6.5.1 成對樣本t檢驗過程的參數設定 100
6.5.2 實例分析 100
第7章 基本圖形的繪製 103
7.1 統計圖概述 103
7.2 條形圖 104
7.3 折線圖 108
7.4 面積圖 110
7.5 餅圖 111
7.5.1 餅圖參數設定 111
7.5.2 實例分析 112
7.6 高低圖 113
7.7 質量控制圖 114
7.8 箱圖 119
7.8.1 箱圖參數設定 119
7.8.2 實例分析 120
7.9 散點圖 121
7.9.1 散點圖參數設定 122
7.9.2 實例分析 122
7.10 直方圖 124
7.11 P-P圖和Q-Q圖 124
7.12 時間序列圖 126
7.12.1 時間序列圖參數設定 126
7.12.2 實例分析 130
第8章 非參數檢驗 133
8.1 非參數檢驗概述 133
8.2 檢驗 134
8.2.1 檢驗的參數設定 135
8.2.2 檢驗實例分析 137
8.3 二項分布檢驗 139
8.3.1 二項分布檢驗的參數設定139
8.3.2 實例分析 139
8.4 遊程檢驗 141
8.4.1 遊程檢驗的參數設定 142
8.4.2 實例分析 142
8.5 單樣本K-S檢驗 144
8.5.1 單樣本K-S檢驗的參數設定 144
8.5.2 實例分析 145
8.6 兩獨立樣本分布位置檢驗 147
8.6.1 兩獨立樣本分布位置檢驗的參數設定 148
8.6.2 實例分析 148
8.7 多個獨立樣本分布位置檢驗 150
8.7.1 多個獨立樣本分布位置檢驗的參數設定 150
8.7.2 實例分析 151
8.8 兩個相關樣本分布位置檢驗 153
8.8.1 兩個相關樣本分布位置檢驗的參數設定 153
8.8.2 實例分析 154
8.9 多個相關樣本分布位置檢驗 155
8.9.1 多個相關樣本分布位置檢驗的參數設定 156
8.9.2 實例分析 156
第9章 方差分析 159
9.1 方差分析的基本原理 159
9.1.1 自由度與平方和分解 160
9.1.2 F檢驗 162
9.1.3 多重比較 163
9.2 單因素ANOVA檢驗 164
9.2.1 單因素ANOVA檢驗步驟 165
9.2.2 判斷與結論 166
9.2.3 單因素 ANOVA檢驗過程的參數設定 167
9.2.4 實例分析 169
9.3 多因素方差分析 170
9.3.1 只考慮主效應的多因素方差分析 171
9.3.2 存在互動效應的多因素方差分析 173
9.3.3 單變數過程參數設定 175
9.3.4 實例分析 179
9.4 協方差分析 183
9.4.1 協方差分析概述 183
9.4.2 實例分析 184
第10章 回歸分析 187
10.1 線性回歸 187
10.1.1 線性回歸模型 188
10.1.2 最小二乘估計 188
10.1.3 回歸方程的顯著性檢驗 189
10.1.4 預測問題 191
10.1.5 SPSS線性回歸分析設定192
10.1.6 回歸分析模型的實例分析196
10.2 非線性回歸 199
10.2.1 非線性回歸分析的基本原理200
10.2.2 非線性回歸參數設定 200
10.2.3 實例分析 203
10.3 Logistic回歸 205
10.3.1 Logistic回歸模型概述 206
10.3.2 二元 Logistic回歸模型參數設定 207
10.3.3 實例分析 210
第11章 相關分析 215
11.1 相關分析概述 215
11.1.1 相關關係 215
11.1.2 相關圖形和相關係數 216
11.1.3 SPSS的相關分析功能簡介218
11.2 雙變數(Bivariate)過程 218
11.2.1 雙變數相關分析簡介 218
11.2.2 雙變數過程的參數設定 220
11.2.3 實例分析 222
11.3 偏相關(Partial)過程 224
11.3.1 偏相關過程的參數設定 224
11.3.2 實例分析 225
11.4 Distances(距離)過程 227
11.4.1 Distances過程的距離分析參數設定 227
11.4.2 實例分析 230
第12章 聚類分析 232
12.1 聚類分析的原理 232
12.1.1 一般原理 233
12.1.2 聚類分析步驟 236
12.1.3 系統聚類方法 237
12.2 快速樣本聚類過程 240
12.2.1 快速聚類簡介 240
12.2.2 SPSS快速聚類的設定 240
12.2.3 實例分析 242
12.3 系統聚類過程 246
12.3.1 系統聚類簡介 246
12.3.2 SPSS系統聚類設定 246
12.3.3 實例分析 249
12.4 二階聚類分析 252
12.4.1 二階聚類簡介 252
12.4.2 SPSS二階聚類的設定 253
12.4.3 實例分析 254
第13章 判別分析 257
13.1 判別分析的基本原理 257
13.1.1 判別分析簡介 257
13.1.2 判別分析的數學模型與判別方法 258
13.2 一般判別分析 265
13.2.1 一般判別分析的參數設定265
13.2.2 實例分析 267
13.3 逐步判別分析 272
13.3.1 逐步判別的參數設定 272
13.3.2 實例分析 273
第14章 因子分析 279
14.1 因子分析簡介 279
14.1.1 因子分析的基本原理 280
14.1.2 因子分析的基本步驟和過程282
14.2 SPSS因子分析 283
14.2.1 SPSS因子分析的參數設定283
14.2.2 實例分析 286
第15章 對應分析 291
15.1 對應分析的基本原理 291
15.2 對應分析 293
15.2.1 對應分析過程的參數設定293
15.2.2 實例分析 296
15.3 最優標度過程 299
15.3.1 最優標度過程的參數設定299
15.3.2 實例分析 306
第16章 可靠性和多維標度分析 310
16.1 可靠性分析 310
16.1.1 可靠性分析的基本原理 310
16.1.2 可靠性分析的參數設定 312
16.1.3 實例分析 314
16.2 多維標度分析 316
16.2.1 多維標度分析簡介 316
16.2.2 多維標度過程的參數設定317
16.2.3 實例分析 320
第17章 生存分析 323
17.1 生存分析簡介 323
17.1.1 生存分析的基本概念 323
17.1.2 生存資料的特點 325
17.1.3 生存分析方法 326
17.1.4 SPSS中的生存分析過程326
17.2 壽命表(Life Tables)過程 327
17.2.1 壽命表分析過程的參數設定327
17.2.2 實例分析 328
17.3 Kaplan-Meier分析 332
17.3.1 Kaplan-Meier分析過程的參數設定 332
17.3.2 實例分析 334
17.4 Cox模型回歸分析 337
17.4.1 Cox回歸模型 337
17.4.2 Cox模型分析過程的參數設定339
17.4.3 實例分析 343
第18章 對數線性模型 348
18.1 對數線性模型概述 348
18.2 常規模型(General)過程 349
18.2.1 常規模型分析過程的參數設定 349
18.2.2 實例分析 351
18.3 分對數(Logit)過程 354
18.3.1 分對數分析過程的參數設定354
18.3.2 實例分析 357
18.4 選擇模型(Model Selection)過程 360
18.4.1 選擇模型分析過程的參數設定 360
18.4.2 實例分析 362
第19章 時間序列分析 365
19.1 時間序列概述 365
19.1.1 時間序列的組成部分 365
19.1.2 時間序列的數學模型 366
19.1.3 時間序列的分析步驟 368
19.1.4 SPSS時間序列分析功能368
19.2 時間序列數據的預處理 375
19.2.1 缺失值替換 375
19.2.2 定義時間變數 376
19.2.3 時間序列預測的平穩化 376
19.3 指數平滑模型過程 377
19.3.1 指數平滑的基本原理 377
19.3.2 指數平滑模型分析過程的參數設定 380
19.3.3 實例分析 381
19.4 ARIMA模型 386
19.4.1 ARIMA模型的基本原理386
19.4.2 ARIMA模型分析過程的參數設定 389
19.4.3 實例分析 390
19.5 季節性分解模型 394
19.5.1 季節性分解模型分析過程的參數設定 394
19.5.2 實例分析 395
第20章 缺失值分析 399
20.1 缺失值理論概述 399
20.1.1 數據缺失方式 400
20.1.2 缺失值處理方法 400
20.2 SPSS缺失值分析 404
20.2.1 缺失值分析過程的參數設定 404
20.2.2 實例分析 408
第21章 決策樹模型 414
21.1 決策樹模型概述 414
21.1.1 CHAID算法 416
21.1.2 Exhaustive CHAID算法417
21.1.3 CRT算法 417
21.1.4 QUEST算法 418
21.2 決策樹的參數設定 418
21.2.1 變數設定 418
21.2.2 類別(Categories)設定419
21.2.3 輸出(Output)設定 420
21.2.4 驗證(Validation)設定 422
21.2.5 保存(Save)設定 423
21.2.6 條件(Criteria)設定 424
21.2.7 CHAID算法設定 425
21.2.8 CRT算法設定 425
21.2.9 QUEST算法設定 426
21.2.10 修剪(Pruning)設定 426
21.2.11 替代變數(Surrogates)設定427
21.2.12 選項(Options)設定 427
21.2.13 錯誤分類成本設定 428
21.2.14 利潤(Profits)設定 428
21.2.15 先驗機率(Prior Probabilities)設定 429
21.2.16 實例分析 430
21.2.17 模型建立 430
21.2.18 模型評估 432
第22章 神經網路 439
22.1 神經網路概述 439
22.1.1 歷史及現狀 440
22.1.2 神經網路特點 441
22.1.3 神經元模型 442
22.1.4 神經網路模型 443
22.1.5 神經網路的學習規則 443
22.1.6 SPSS神經網路模型 444
22.2 SPSS神經網路模型的設定 447
22.2.1 多層感知器(MLP)分析過程的參數設定 447
22.2.2 徑向基函式(RBF)分析過程的參數設定 454
22.3 實例分析 456
22.3.1 參數設定 457
22.3.2 結果分析 459
第23章 信用風險分析 464
23.1 信用風險概述 464
23.1.1 信用風險基本概念 464
23.1.2 信用風險度量方法 465
23.1.3 SPSS中信用風險分析模組468
23.2 實例分析 468
23.2.1 二元Logistic分析過程 468
23.2.2 決策樹分析過程 474
23.2.3 判別式分析過程 479
第24章 SPSS在社會經濟 綜合評價中的套用 484
24.1 沿海省市經濟綜合指標的主成分分析 484
24.2 中國內地城鎮居民消費結構的聚類分析 488
24.3 我國內地可支配收入和消費性支出之間的回歸分析 492

相關詞條

熱門詞條

聯絡我們