內容簡介
本書是數據分析與數據挖掘課程的實驗指導書,結合大量實例全面闡述了使用 IBM SPSS 系列軟體進行數據分析與挖掘的原理、方法和步驟。緊密配合理論教學, 使學生在有限的實驗課時中,加深對所學知識的理解和掌握。
全書分為兩個部分,第一部分為數據分析實驗,主要介紹如何利用IBM SPSS Statistics 軟體進行統計分析,具體包括描述性統計、參數檢驗、非參數檢驗、相關分析、回歸分析和因子分析等七項實驗科目,第二部分為數據挖掘實驗,主要介紹如何利用IBM SPSS Modeler 軟體進行數據挖掘,具體包括關聯規則挖掘、決策樹分類、人工神經網路分類、貝葉斯方法分類和聚類等七項實驗科目。本書可作為數據工程相關專業本科生教材,也可為從事各領域數據分析和數據挖掘的專業人員提供指導和幫助。
目錄
實驗1IBMSPSSStatistics軟體使用基礎1
1.1實驗目的與要求1
1.2實驗原理1
1.3實驗內容與步驟1
1.3.1安裝、啟動與退出1
1.3.2定義變數3
1.3.3數據的輸入與保存6
1.3.4數據檔案的編輯與轉換7
1.4思考題12
實驗2描述性統計13
2.1實驗目的與要求13
2.2實驗原理13
2.3實驗內容與步驟14
2.3.1中心、離散趨勢描述實驗14
2.3.2頻數分布分析實驗18
2.4思考題24
實驗3參數檢驗26
3.1實驗目的與要求26
3.2實驗原理26
3.3實驗內容與步驟28
3.3.1單樣本t檢驗28
3.3.2兩獨立樣本t檢驗29
3.3.3兩配對樣本t檢驗31
3.3.4單因素完全隨機設計的方差分析SPSS過程33
3.3.5單因素重複測量設計的方差分析SPSS過程37
3.3.6多因素完全隨機設計方差分析的SPSS過程40
3.4思考題45
實驗4非參數檢驗46
4.1實驗目的與要求46
4.2實驗原理46
4.3實驗內容與步驟47
遇
4.3.1單樣本二項分布檢驗的SPSS過程47
4.3.2相關樣本二項分布檢驗的SPSS過程50
4.3.3獨立樣本二項分布檢驗的SPSS過程53
4.3.4適合性卡方檢驗的SPSS過程55
4.3.5獨立性卡方檢驗的SPSS過程59
4.3.6符號與符號秩次檢驗的SPSS過程62
4.3.7秩和檢驗(曼-惠特尼U檢驗)的SPSS過程63
4.3.8中位數檢驗的SPSS過程65
4.4思考題67
實驗5相關分析69
5.1實驗目的與要求69
5.2實驗原理69
5.3實驗內容與步驟70
5.3.1二元變數相關分析的SPSS過程70
5.3.2肯德爾和諧係數計算的SPSS過程72
5.3.3偏相關分析的SPSS過程75
5.4思考題79
實驗6回歸分析80
6.1實驗目的與要求80
6.2實驗原理80
6.3實驗內容與步驟81
6.3.1一元線性回歸分析的SPSS過程81
6.3.2多元線性回歸分析的SPSS過程84
6.4思考題89
實驗7因子分析91
7.1實驗目的與要求91
7.2實驗原理91
7.3實驗內容與步驟92
7.3.1因子分析的SPSS過程92
7.3.2因素分析結果的讀取與解釋97
7.4思考題102
實驗8IBMSPSSModeler軟體使用基礎103
8.1實驗目的與要求103
8.2實驗原理103
8.2.1IBMSPSSModeler簡介103
8.2.2數據挖掘的CRISP-DM模型103
8.2.3Modeler軟體使用的技巧105
8.3實驗內容與步驟107
8.3.1Modeler的啟動和界面布局107
8.3.2完整建模流程的介紹110
8.4思考題114
實驗9關聯規則挖掘實驗115
9.1實驗目的與要求115
9.2實驗原理115
9.2.1關聯規則處理數據的兩種形式115
9.2.2關聯規則相關概念116
9.3實驗內容與步驟117
9.3.1Apriori算法套用117
9.3.2序列關聯套用123
9.4思考題127
實驗10決策樹分類實驗128
10.1實驗目的與要求128
10.2實驗原理128
10.2.1決策樹分類原理128
10.2.2決策樹分類常用算法128
10.3實驗內容與步驟129
10.3.1導入數據129
10.3.2數據認識與處理130
10.3.3建立模型與評估134
10.4思考題136
實驗11支持向量機SVM分類實驗137
11.1實驗目的與要求137
11.2實驗原理137
11.3實驗內容與步驟138
11.3.1導入數據138
11.3.2建立模型139
11.4思考題143
實驗12人工神經網路分類實驗144
12.1實驗目的與要求144
12.2實驗原理144
12.3實驗內容與步驟145
12.3.1導入數據145
12.3.2模型建立145
12.4思考題151
實驗13貝葉斯方法分類實驗152
13.1實驗目的與要求152
13.2實驗原理152