數據挖掘與套用

數據挖掘與套用

《數據挖掘與套用》是2009年北京大學出版社出版的圖書,作者是張俊妮。本書全面地介紹了數據挖掘的相關主題,包括數據理解與數據準備、關聯規則挖掘、多元統計中的降維方法、聚類分析、神經網路、決策樹方法、模型評估等內容。

基本介紹

內容簡介,作者簡介,圖書目錄,叢書信息,

內容簡介

《數據挖掘與套用》全書體系完整,文字精煉,注重對數據挖掘方法的直覺理解及其套用:同時,保持了一定的嚴謹性,為學生理解和運用這些方法提供了堅實的基礎。
《數據挖掘與套用》實例豐富,並附有相應SAS程式,以便於學生儘快理解相關內容並用以解決實際問題。
《數據挖掘與套用》配有教輔,可以免費提供給任課教師使用。如需要,歡迎填寫書後的“教師反饋及課件申請表’索取。

作者簡介

張俊妮,美國哈佛大學統計學博士,現為北京大學光華管理學院商務統計及經濟計量系副教授。研究領域包括因果推斷、貝葉斯分析、蒙特卡洛方法、數據挖掘。

圖書目錄

第一章 數據挖掘概述
1.1 什麼是數據挖掘
1.2 數據挖掘的套用
1.3 數據挖掘方法論
第二章 數據理解和數據準備
2.1 數據理解
2.2 數據準備
3使用SAS進行數據理解和數據準備:
FNBA信用卡數據
第三章 關聯規則挖掘
3.1 關聯規則的實際意義
3.2 關聯規則的基本概念及Apriori算法
3.3 負關聯規則
3.4 序列關聯規則
3.5 使用SAS進行關聯規則挖掘
第四章 多元統計中的降維方法
4.1 攔成分分析
4.2 探索性因子分析
4.3 多維標度分析
第五章 聚類分析
5.1 距離與相似度的度量
5.2 A均值聚類法
5.3 層次聚類
第六章 預測性建模的一些基本方法
6.1 判別分析
6.2 樸素貝葉斯分類算法
6.3 K近鄰法
6.4.線性模型與廣義線性模型
第七章 神經網路
7.1 神經網路架構及基本組成
7.2 誤差函式
7.3 神經網路訓練算法
7.4 提高神經網路模型的可推廣性
7.5 數據預處理
7.6 使用SAS建立神經網路模型
7.7 自組織圖
第八章 決策樹
8.1 決策樹簡介
8.2 決策樹的生長與修剪
8.3 對缺失數據的處理
8.4 變數選擇
8.5 決策樹的優缺點
第九章 模型評估
9.1 因變數為二分變數的情形
9.2 因變數為多分變數的情形
9.3 因變數為連續變數的情形
9.4 使用SAS評估模型
第十章 模型組合與兩階段模型
10.1 模型組合
10.2 隨機森林
10.3 兩階段模型
參考文獻
……

叢書信息

北京大學光華管理學院教材 (共3冊), 這套叢書還有 《固定收益證券》,《套用商務統計分析》。

相關詞條

熱門詞條

聯絡我們