《Excel 2007數據挖掘完全手冊》是2008年清華大學出版社出版的圖書,作者是謝邦昌、朱建平、來升強。
基本介紹
- 書名:Excel 2007數據挖掘完全手冊
- 作者:謝邦昌、朱建平、來升強
- ISBN:9787302174745
- 定價:32元
- 出版社:清華大學出版社
- 出版時間:2008.07.01
內容簡介,目錄,
內容簡介
本書圍繞Excel2007的數據挖掘模組,通過大量操作示範,介紹了主流的數據挖掘方法。全書包括數據挖掘算法介紹、Excel2007數據挖掘模組介紹、其他分析工具介紹、數據挖掘範例4篇,共26章。除了給出有關的理論和原理闡述之外,還提供了一些大型套用案例。通過詳細的操作講解和結果分析,讀者可以獲得實際的數據挖掘經驗,並能迅速地在自己所處的領域中加以套用。
利用Excel2007的數據挖掘模組,讀者無須經過專業培訓,就能完成多種數據挖掘任務。本書適用於學習數據挖掘和相關課程的學生、運用Excel2007進行複雜大型數據分析的職場人士及諮詢公司從業人員等。前言
目前,各行各業都開始利用計算機及相應的信息技術進行管理和決策,這使得各企事業單位生成、收集、存儲和處理數據的能力大大提高。數據量與日俱增,大量複雜信息層出不窮,人們將面臨著複雜數據的處理問題。Excel是當前使用最普遍的電子表格軟體,它能容易地完成圖表的製作、統計、分析以及數據處理,不但功能強大,而且簡單易用。最新版本的MicrosoftOfficeExcel2007支持超過104萬筆記錄的單張數據工作表,並可以同時存儲1.6萬列的數據。為能有效提升Excel2007用戶數據處理和分析的能力,微軟公司提供了一個免費的數據挖掘模組。通過調用該模組,Excel2007用戶可以方便快速地完成以往只有使用專業數據挖掘軟體才能完成的任務。因此,我們編寫了《Excel2007數據挖掘完全手冊》這本書,其目的是使具有一定Excel基礎的讀者,能夠在了解相關統計思想與方法的基礎上,運用該軟體對複雜數據和海量數據進行處理、分析。
本書的編寫力求以統計思想為主線,以數據挖掘技術套用為目的。基本內容和特點具體體現為:第1篇詳細敘述數據挖掘的一般概念、通行規範、方法技術以及軟體套用等,使讀者獲得一個較為清晰和正確的數據挖掘觀念。第2篇圍繞Excel2007的數據挖掘模組,通過大量操作示範,詳細講述了Excel2007數據挖掘模組的九大模型的使用。這些模型包括決策樹、貝葉斯機率分類、關聯規則、聚類分析、時序聚類、線性回歸、Logistic回歸、類神經網路和時間序列分析,基本涵蓋了主要的數據挖掘技術和方法。第3篇介紹了Excel2007的其他分析工具,結合數據挖掘技術和方法,使用改進的Excel表格工具,可以很方便地進行圖形化的分析。第4篇是數據挖掘的案例分析,包括投資決策、信用評級,以及市場銷售和客戶細分等領域的數據挖掘模型。通過詳細的操作講解和結果解釋,讀者可以獲得實際的數據挖掘經驗,並能迅速在自己所處的領域中加以套用。
本書適合多層次多專業人士如數學、統計、經濟金融、管理類等專業的本科生、專科生學習,還適合於非統計類的研究生及從事相關數據分析的人員閱讀。
目錄
第1篇數據挖掘算法介紹
第1章數據挖掘簡介 3
1.1數據挖掘的定義 3
1.2數據挖掘的重要性 3
1.3數據挖掘的功能 3
1.4數據挖掘的步驟 4
1.5數據挖掘建模的標準CRISP-DM 5
第2章數據挖掘運用的理論和技術 7
2.1回歸分析 7
2.1.1簡單線性回歸分析 7
2.1.2多元回歸分析 7
2.1.3嶺回歸分析 8
2.1.4Logistic回歸分析 9
2.2關聯規則 9
2.3聚類分析 10
2.4判別分析 11
2.5類神經網路分析 12
2.6決策樹分析 13
2.7其他分析方法 15
第3章數據挖掘與相關領域的關係 17
3.1數據挖掘與統計分析的不同 17
3.2數據挖掘與數據倉儲的關係 17
3.3知識發現與數據挖掘的關係 18
3.4OLAP與數據挖掘的關係 19
3.5數據挖掘與機器學習的關係 19
3.6網路挖掘與數據挖掘的關係 20
第4章數據挖掘商業軟體產品及其套用現狀 21
4.1數據挖掘商業軟體的分類 21
4.2主要軟體的介紹 21
4.3顧客關係管理 22
4.4數據挖掘的行業套用 23
第2篇Excel2007數據挖掘模組介紹
第5章安裝與設定Excel2007數據挖掘載入項 27
5.1系統需求 27
5.2開始安裝 27
5.3完成安裝驗證 30
5.4組件設定 30
5.5配置完成檢查 35
第6章Excel2007數據挖掘入門 37
6.1Excel2007數據挖掘功能介紹 37
6.2數據挖掘使用說明 37
6.2.1目錄查詢 37
6.2.2開始功能 38
6.2.3視頻和教學 39
6.3數據挖掘連線配置 39
6.3.1設定目前的連線 39
6.3.2跟蹤 41
6.4數據準備 41
6.4.1瀏覽數據 41
6.4.2清除數據 44
6.4.3分割數據 46
6.5數據建模 50
6.6精確度和驗證 51
6.6.1準確性圖表 51
6.6.2分類矩陣 52
6.6.3利潤圖 53
6.7模型用法 53
6.7.1瀏覽功能 53
6.7.2查詢功能 56
6.8模型管理 57
6.8.1重新命名挖掘模型 57
6.8.2刪除挖掘結構 57
6.8.3清除挖掘結構 58
6.8.4用原始數據處理挖掘結構 58
6.8.5用新數據處理挖掘結構 58
6.8.6導出挖掘結構 59
6.8.7導入挖掘結構 60
第7章決策樹 61
7.1基本概念 61
7.2決策樹模組的建立 61
7.3決策樹與判別函式比較 61
7.4計算方法 62
7.4.1確定預測精度的標準 62
7.4.2選擇分裂(分層)技術 62
7.4.3定義停止分裂(分層)的時間點 62
7.4.4選擇適當大小的決策樹 63
7.5Excel2007決策樹算法 63
第8章貝葉斯機率分類 71
8.1基本概念 71
8.2Excel2007貝葉斯機率分類 73
第9章關聯規則 84
9.1基本概念 84
9.2關聯規則的種類 85
9.3關聯規則的算法:Apriori算法 85
9.4Excel2007關聯規則 86
第10章聚類分析 96
10.1基本概念 96
10.2層次聚類分析 96
10.3聚類分析原理 97
10.4Excel2007聚類分析 100
第11章時序聚類 116
11.1基本概念 116
11.2相關研究和算法 116
11.3Excel2007時序聚類 117
第12章線性回歸 126
12.1基本概念 126
12.2簡單回歸分析 127
12.3多元回歸分析 130
12.4Excel2007線性回歸 133
第13章Logistic回歸 142
13.1基本概念 142
13.2logit變換 142
13.3Logistic分布 143
13.4列聯表的Logistic回歸模型 144
13.5Excel2007Logistic回歸 145
第14章類神經網路 161
14.1基本概念 161
14.2類神經網路的架構與訓練算法 163
14.3類神經網路的特性 163
14.4類神經網路套用 163
14.5類神經網路優缺點 164
14.6Excel2007類神經網路 165
第15章時間序列分析 175
15.1基本概念 175
15.2時間序列的成分 177
15.3時間序列數據的圖形介紹 178
15.4利用平滑法預測 182
15.5用趨勢方程預測時間序列 186
15.6預測含趨勢與季節成分的時間序列 187
15.7利用回歸模型預測時間序列 188
15.8其他預測模型 189
15.9單變數時間序列預測模型 189
15.10時間趨勢預測模型 192
15.11Excel2007時間序列 193
第16章DMX介紹 198
16.1DMX介紹 198
16.2DMX函式介紹 199
16.2.1模型建立 200
16.2.2模型訓練 201
16.2.3模型使用(預測) 201
16.2.4其他函式語法 202
16.3DMX數據挖掘語法 205
16.3.1決策樹 206
16.3.2貝葉斯機率分類 207
16.3.3關聯規則 207
16.3.4聚類分析 208
16.3.5時序聚類 209
16.3.6線性回歸 210
16.3.7Logistic回歸 211
16.3.8類神經網路 212
16.3.9時間序列 213
16.4DMX套用範例 214
16.4.1分類 215
16.4.2估計 216
16.4.3預測 217
16.4.4關聯分組 217
16.4.5聚類 218
第3篇其他分析工具介紹
第17章分析關鍵影響因素 223
第18章檢測類別 228
第19章從示例填充 231
第20章預測 233
第21章突出顯示異常值 235
第22章套用場景分析 238
22.1目標查找 238
22.2假設 240
第23章Visio2007數據透視分析 243
第4篇數據挖掘範例
第24章上市公司投資價值分析的挖掘模型 251
24.1研究動機與目的 251
24.2挖掘模型的構建 251
24.3變數篩選 252
24.4決策樹模型 253
24.5貝葉斯機率模型 255
24.6Logistic回歸模型 255
24.7預測準確度比較 256
第25章信用卡用戶信用評測的挖掘模型 259
25.1研究背景 259
25.2研究動機 260
25.3研究目的 260
25.4Excel2007構建數據挖掘模型 260
25.4.1決策樹分析 260
25.4.2聚類分析 263
25.4.3Logistic回歸 269
第26章市場行銷與客戶細分的挖掘模型 271
26.1研究動機與目的 271
26.2研究方法與限制 271
26.3數據分析 271
26.4挖掘建模 273
26.4.1決策樹 273
26.4.2單純貝葉斯分類 280
26.4.3聚類分析 282
26.4.4決策樹 286
26.4.5Logistic回歸 288
26.4.6關聯分析 292
26.5結論 295