大數據精準挖掘

大數據精準挖掘

《大數據精準挖掘》是2014年3月化學工業出版社出版的圖書,作者是吳昱。

基本介紹

  • 中文名:大數據精準挖掘
  • 別名:中國雲計算套用叢書
  • 作者:吳昱
  • 出版時間:2014年3月
  • 頁數:174 頁
  • ISBN:978-7-122-18992-9
  • 類別:計算機
  • 開本:16K 787×1092 1/16
  • 裝幀:平
內容簡介,目錄,

內容簡介

本書以新興的大數據時代最實用的技術為支撐,以廣闊的科技視野和紮實的專業功底,全面介紹了大數據時代的由來和背景,闡述了與大數據分析相關的理論和數學模型。特別難能可貴的是,本書從蘊含大數據技術的精準數據挖掘工具入手,結合實際的成功案例,將數據精準挖掘的全過程和詳細步驟,包括結果驗證等方面內容,詳詳細細並非常專業地展現給讀者。本書理論和實踐密切結合,文字流暢,深入淺出,通俗易懂。
通過本書的學習,可以掌握當下大數據所涉及的主要數學分析模組的要點,並比較相互的特點。同時,能夠學會實用的數據挖掘專門技術及經歷數據挖掘的全過程。由於本書所介紹的技術與我國目前大數據運用的領軍行業金融、保險、電信、電子商務等密切相連,故本書有很強的實用性,能達到學以致用、邊學邊用的效果。
本書適合我國IT業的科研機構、相關企業的專業技術人員的學習之用;本書還可以作為政府部門制定大數據發展戰略時的參考。本書也適合全國高等院校的大學生和研究生學習使用;由於本書將理論與具體操作合二為一,故也能作為全國大專院校開設大數據實驗課程的教材。

目錄

第1篇基礎篇
第1章大數據時代下的數據挖掘3
11大數據的基礎4
111大數據呈現出了數據的新價值4
112數據採集、存儲與提取技術信息化5
113數據挖掘技術是大數據時代最本質特徵5
12大數據的特點6
121數據規模大6
122數據類型多6
123價值密度低,但總體的數據價值高7
124數據處理有速度要求7
13大數據的作用7
131數據已滲透到社會每個角落8
132數據成為競爭的新元素8
133數據創造新價值9
134大數據地位不斷躍升9
14大數據與數據挖掘10
141數據挖掘技術是大數據時代的靈魂和核心10
142數據挖掘技術涉及多種多類的知識節點10
143選擇最好的數據挖掘工具10
15令人期待的大數據時代11
16本章小結11
第2章大數據與雲計算13
21大數據與雲計算13
211大數據與雲計算關係13
212大數據擴展了雲計算服務類型14
213雲計算數據存儲系統得到推廣14
214追求集成一體化技術14
215大數據和雲計算缺一不可15
22雲計算的定義與特點15
221雲計算的定義15
222雲計算的特點15
23雲計算的基本架構16
231雲計算架構的基本層次16
232雲計算架構的服務層次16
24雲計算的關鍵技術17
241虛擬化技術17
242數據存儲技術19
243資源管理技術19
244雲計算中的編程模型20
245集成一體化技術21
246自動化技術21
25雲計算的商業模式21
251商業模式是雲計算的基石21
252雲計算的市場規模22
253雲計算商業模式分析22
26本章小結23
第2篇理論篇
第3章數據挖掘的主要方法及工具27
31數據挖掘主要方法27
311決策樹分類27
312神經網路33
313Logistic回歸方法37
314聚類分析38
315數據挖掘方法比較39
316分類器的評估與選擇40
32流行數據分析平台及數據挖掘工具介紹46
33本章小結52
第4章Logistic回歸模型53
41多元線性回歸模型53
42Logistic回歸模型55
43Logistic回歸模型的參數估計56
44Logistic回歸模型中回歸係數的意義58
45Logistic回歸模型的擬合優度63
46Logistic回歸係數的顯著性檢驗72
47Logistic回歸模型的預測準確性75
48回歸變數的選擇與逐步回歸77
49本章小結83
第5章數據挖掘建模過程86
51CRISPDM86
52SAS數據挖掘方法論——SEMMA88
53數據挖掘經驗談89
54本章小結89
第3篇套用篇
第6章金融行業套用1——信用評分93
61國內信用卡業務現狀93
62信用評分模型的起源、類別和發展94
63信用評分的步驟95
64實例演示97
641二元變數預測建模98
642圖形版建模輸出講解1——效果評價101
643圖形版建模輸出講解2——評分卡檔案103
65本章小結109
第7章金融行業套用2——信用卡催收評分110
71信用卡催收評分模型背景介紹110
72實例演示112
721圖形版連續變數預測建模112
722圖形版建模輸出114
73本章小結116
第8章保險電銷套用——尋找目標客戶117
81背景介紹117
82案例數據展示及分析118
821業務目標118
822數據展示118
83數據挖掘與分析過程120
831數據預處理120
832造變數122
833生成挖掘表123
834建立回響模型125
835建模結果分析125
84數據挖掘結果的運用129
85本章小結129
第9章電信行業套用——客戶流失預測131
91背景介紹131
92案例數據展示及分析131
921商業理解131
922數據理解132
923數據準備132
93建立打分模型133
94分析建模結果134
95數據挖掘結果的運用136
96本章小結137
第10章商品零售行業套用——購物籃分析138
101某連鎖零售公司的背景介紹138
102購物籃分析的基本內容139
1021同次購買的基本概念139
1022同次購買的關聯規則質量的衡量140
1023購買分析的實現141
1024下次購買的基本概念142
1025下次購買行為預測142
103購物籃分析——MBA工具的使用145
1031MBA工具的用途145
1032MBA工具的使用146
1033MBA工具的輸出146
104本章小結149
第11章實戰項目——交叉銷售150
111背景介紹150
112案例數據展示及分析151
1121數據展示151
1122業務目標及分析要求152
113數據挖掘過程152
1131數據預處理152
1132劃分數據集及生成目標變數153
1133生成衍生變數154
1134生成挖掘表159
114建立打分模型160
115結果分析161
116本章小結162
第12章收益預測163
121背景介紹163
122數據展示163
1221原始數據集展示163
1222數據挖掘表的生成165
123圖形版建模166
1231建模過程166
1232模型輸出166
1233為新數據集打分168
124本章小結170
參考文獻172

相關詞條

熱門詞條

聯絡我們