《數據挖掘理論與實例》的主要內容包括理論和實例兩部分:第一、第二章介紹數據挖掘、數據倉庫和數據挖掘的常用技術等基本理論;實例部分是以作者的兩個研究課題為基礎,第三、第四章介紹呼叫中心數據倉庫的構建和數據挖掘模型與實現(MSSQLServer2000、決策樹);第五、第六章介紹數據挖掘在QFII投資理念與持股偏好研究中的套用(Rsoft—ware、MySQL、多元逐步線性回歸、因子分析、聚類分析等)。
基本介紹
- 中文名:數據挖掘理論與實例
- ISBN:9787514118148
- 出版社:經濟科學出版社
- 頁數:231頁
- 開本:32
- 定價:25.00
- 作者:王暉 王琪
- 出版日期:2012年7月1日
- 語種:簡體中文
內容簡介
圖書目錄
第一節什麼是數據挖掘
第二節基本數據挖掘任務
第三節數據挖掘的過程
第四節數據倉庫與OLAP技術概述
第五節數據挖掘技術的發展
第二章數據挖掘工具
第一節數據挖掘的統計方法
第二節聚類分析
第三節決策樹
第四節相關軟體
第三章呼叫中心中數據倉庫的構建
第一節數據倉庫構建的實施方法及步驟
第二節呼叫中心數據倉庫模型設計
第三節數據倉庫生成
第四章呼叫中心中的數據挖掘模型與實現
第一節問題鑑別
第二節解決方案
第三節基於決策樹的分類算法模型
第四節C4.5算法構造信息需求分類和客戶細分決策樹實例
第五節功能模組的實現
第六節系統套用示例
第五章QFII投資理念與持股偏好研究中數據收集與整理
第一節外國機構投資者投資理念及持股偏好概述
第二節QFII重倉股數據來源
第三節因變數的選取
第四節自變數的選取
第六章QFII投資理念與持股偏好研究中數據挖掘模型與實現
第一節重倉股家數變化趨勢和行業分布
第二節重倉股持有時間特徵
第三節描述性統計分析
第四節相關性分析
第五節持股偏好多元線性逐步回歸分析
參考文獻
附表
附表1 12家QFII基本情況及最新額度
附表2瑞士銀行的名稱
附表3 12家QFII持有股票家數和行業情況匯總
附表4各季度因變數和自變數的均值及樣本個數
附表5各季度因變數和自變數的方差及樣本個數
附表6 2008年12月31日Y對上一個季度所有自變數線性相關係數
附表7Y對上一個季度、本季度及未來一個季度的所有自變數X逐步回歸模型係數情況
附表8兩種方式回歸結果對比
附錄
附錄一數據倉庫中的數據表架構
附錄二數據倉庫關係圖
附錄三QFII重倉股數據的獲取過程
附錄四自變數數據的獲得及缺失值處理
附錄五模型建立一數據分析過程