《國外經典教材·數據挖掘教程》為數據挖掘的基礎教程,是作者多年來從事數據挖掘和專家系統課程教學經驗的總結。它從商業角度介紹了數據挖掘的原理以及從數據中提取隱含模式的技術。《國外經典教材·數據挖掘教程》首先幫助讀者建立起數據挖掘的概念,進而通過13個數據挖掘示例幫助讀者掌握數據挖掘的原理。《國外經典教材·數據挖掘教程》的最後部分還介紹了結合專家系統和智慧型代理解決複雜問題的方法。
基本介紹
- 書名:國外經典教材•數據挖掘教程
- 作者:(美國)羅傑 (Richard J.Roiger) (美國)吉茨 (Michael W.Geatz)
- 原版名稱:Date Mining A Tutorial-based Primer
- 譯者:翁敬農 戴紅
- ISBN:7302074569, 9787302074564
- 頁數:362頁
- 出版社:清華大學出版社
- 出版時間:2003年11月1日
- 開本:16開
- 語種:簡體中文
- 品牌:清華大學出版社
基本介紹,內容簡介,作者簡介,圖書目錄,文摘,序言,
基本介紹
內容簡介
《國外經典教材·數據挖掘教程》適合作為信息管理系統(MIS)和計算機科學專業的大學教授。它還可以為研究生提供數據挖掘和知識發現的基礎知識。它也適合對使用數據挖掘解決商業問題感興趣的專業人士作為自學指導。
作者簡介
作者:(美國)羅傑 (Richard J.Roiger) (美國)吉茨 (Michael W.Geatz) 譯者:翁敬農 戴紅
Richard J.Roiger,於1991年獲得了明尼蘇達大學的計算機科學博士學位。他在州立曼凱托大學以優異的成績獲得了數學學士和碩士學位。Richard已經發表了20多篇關於數據挖掘和知識發現的論文。他是美國人工智慧協會以及美國計算機協會的成員。目前,Roiger是州立明尼蘇達大學的一名教授,同時還是InformationAcumenCorporation的一名顧問。Michaelw.Geatz是InformationAcumenCotDotation的創始人之一,該公司從事人工智慧軟體諮詢。同時他還是IntelliPatch的總裁。早先,他是高科技條形碼製造公司USATechnologies,Inc.的總裁。他於1991年獲得了金門大學自勺MBA學位。
Richard J.Roiger,於1991年獲得了明尼蘇達大學的計算機科學博士學位。他在州立曼凱托大學以優異的成績獲得了數學學士和碩士學位。Richard已經發表了20多篇關於數據挖掘和知識發現的論文。他是美國人工智慧協會以及美國計算機協會的成員。目前,Roiger是州立明尼蘇達大學的一名教授,同時還是InformationAcumenCorporation的一名顧問。Michaelw.Geatz是InformationAcumenCotDotation的創始人之一,該公司從事人工智慧軟體諮詢。同時他還是IntelliPatch的總裁。早先,他是高科技條形碼製造公司USATechnologies,Inc.的總裁。他於1991年獲得了金門大學自勺MBA學位。
圖書目錄
第I部分 數據挖掘基礎
第1章 數據挖掘:初探
1.1 數據挖掘:定義
1.2 計算機可以學習什麼
1.3 數據挖掘是否適合自身的問題
1.4 採用專家系統還是數據挖掘
1.5 一個簡單的數據挖掘處理模型
1.6 為什麼不進行簡單的搜尋
1.7 數據挖掘套用
1.8 本章小結
1.9 關鍵術語
1.10 練習
第2章 數據挖掘:深入討論
2.1 數據挖掘策略
2.2 有指導的數據挖掘技術
2.3 關聯規則
2.4 聚類技術
2.5 評估性能
2.6 本章小結
2.7 關鍵術語
2.8 練習
第3章 基本數據挖掘技術
3.1 決策樹
3.2 生成關聯規則
3.3 K-平均值算法
3.4 遺傳學習
3.5 選擇一種數據挖掘技術
3.6 本章小結
3.7 關鍵術語
3.8 練習
第4章 基於Excel的數據挖掘工具
4.1 iData分析器
4.2 ESX:一種多用途的數據挖掘工具
4.3 iDAV格式的數據挖掘
4.4 用於無指導聚類的5步法
4.5 用於有指導學習的6步法
4.6 生成規則技術
4.7 實例典型性
4.8 特別考慮和特性
4.9 本章小結
4.10 關鍵術語
4.11 練習
第II部分 知識發現工具
第5章 資料庫中的知識發現
5.1 一種KDD過程模型
5.2 步驟1:目標定義
5.3 步驟2:創建目標數據集
5.4 步驟3:數據預處理
5.5 步驟4:數據轉換
5.6 步驟5:數據挖掘
5.7 步驟6:解釋和評估
5.8 步驟7:採取行動
5.9 CRISP-DM過程模型
5.10 ESX實驗
5.11 本章小結
5.12 關鍵術語
5.13 練習
第6章 數據倉庫
6.1 操作型資料庫
6.2 設計數據倉庫
6.3 在線上分析處理
6.4 用Excel數據透視表分析數據
6.5 本章小結
6.6 關鍵術語
6.7 練習
第7章 形式評估技術
7.1 評估對象
7.2 評估工具
7.3 計算檢驗集置信區間
7.4 比較有指導學習者模型
7.5 屬性評估
7.6 無指導評估技術
7.7 評估具有數值輸出的有指導模型
7.8 本章小結
7.9 關鍵術語
7.10 練習
第III部分 高級數據挖掘技術
第8章 神經網路
8.1 前饋神經網路
8.2 神經網路訓練:概念介紹
8.4 一般考慮
8.5 神經網路訓練:詳細說明
8.6 本章小結
8.7 關鍵術語
8.8 練習
第9章 使用iDA建立神經網路
9.1 反向傳播學習的4步法
9.2 神經網路聚類4步法
9.3 使用ESX進行神經網路簇分析
9.4 本章小結
9.5 關鍵術語
9.6 練習
第10章 統計技術
10.1 線性回歸分析
10.2 對數回歸
10.3 貝葉斯分類器
10.4 聚類算法
10.5 啟發式的還是統計的
10.6 本章小結
10.7 關鍵術語
10.8 練習
第11章 專門技術
11.1 時間序列分析
11.2 挖掘Web
11.3 挖掘文本數據
11.4 改進性能
11.5 本章小結
11.6 關鍵術語
11.7 練習
第IV部分 智慧型系統
第12章 基於規則的系統
12.1 探索人工智慧
12.2 狀態空間搜尋的問題求解
12.3 專家系統
12.4 構造基於規則的系統
12.5 本章小結
12.6 關鍵術語
12.7 練習
第13章 基於規則的系統中不確定性的管理
13.1 不確定性:來源和解決方案
13.2 基於規則的模糊系統
13.3 不確定性的基於機率的方法
13.4 本章小結
13.5 關鍵術語
13.6 練習
第14章 智慧型代理
14.1 智慧型代理的特徵
14.2 智慧型代理的分類
14.3 整合數據挖掘、專家系統和智慧型代理
14.4 本章小結
14.5 關鍵術語
14.6 練習
附錄A iDA軟體
A.1 軟體安裝
A.2 卸載iDA
A.3 軟體局限性
A.4 軟體使用指南
A.5 故障檢測
A.6 軟體支持
附錄B 數據挖掘數據集
B.1 iDA數據集包
B.2 所要挖掘的數據集所在的Web站點
附錄C 決策樹屬性選取
附錄D 性能評估的統計
D.1 單位匯總統計
D.2 常態分配
D.3 比較有指導學習模型
D.4 數值輸出的置信區間
D.5 比較具有數值輸出的模型
附錄E Excel數據透視表:Office 97
E.1 創建簡單數據透視表
E.2 假設檢驗的數據透視表
E.3 創建多維數據透視圖
第1章 數據挖掘:初探
1.1 數據挖掘:定義
1.2 計算機可以學習什麼
1.3 數據挖掘是否適合自身的問題
1.4 採用專家系統還是數據挖掘
1.5 一個簡單的數據挖掘處理模型
1.6 為什麼不進行簡單的搜尋
1.7 數據挖掘套用
1.8 本章小結
1.9 關鍵術語
1.10 練習
第2章 數據挖掘:深入討論
2.1 數據挖掘策略
2.2 有指導的數據挖掘技術
2.3 關聯規則
2.4 聚類技術
2.5 評估性能
2.6 本章小結
2.7 關鍵術語
2.8 練習
第3章 基本數據挖掘技術
3.1 決策樹
3.2 生成關聯規則
3.3 K-平均值算法
3.4 遺傳學習
3.5 選擇一種數據挖掘技術
3.6 本章小結
3.7 關鍵術語
3.8 練習
第4章 基於Excel的數據挖掘工具
4.1 iData分析器
4.2 ESX:一種多用途的數據挖掘工具
4.3 iDAV格式的數據挖掘
4.4 用於無指導聚類的5步法
4.5 用於有指導學習的6步法
4.6 生成規則技術
4.7 實例典型性
4.8 特別考慮和特性
4.9 本章小結
4.10 關鍵術語
4.11 練習
第II部分 知識發現工具
第5章 資料庫中的知識發現
5.1 一種KDD過程模型
5.2 步驟1:目標定義
5.3 步驟2:創建目標數據集
5.4 步驟3:數據預處理
5.5 步驟4:數據轉換
5.6 步驟5:數據挖掘
5.7 步驟6:解釋和評估
5.8 步驟7:採取行動
5.9 CRISP-DM過程模型
5.10 ESX實驗
5.11 本章小結
5.12 關鍵術語
5.13 練習
第6章 數據倉庫
6.1 操作型資料庫
6.2 設計數據倉庫
6.3 在線上分析處理
6.4 用Excel數據透視表分析數據
6.5 本章小結
6.6 關鍵術語
6.7 練習
第7章 形式評估技術
7.1 評估對象
7.2 評估工具
7.3 計算檢驗集置信區間
7.4 比較有指導學習者模型
7.5 屬性評估
7.6 無指導評估技術
7.7 評估具有數值輸出的有指導模型
7.8 本章小結
7.9 關鍵術語
7.10 練習
第III部分 高級數據挖掘技術
第8章 神經網路
8.1 前饋神經網路
8.2 神經網路訓練:概念介紹
8.4 一般考慮
8.5 神經網路訓練:詳細說明
8.6 本章小結
8.7 關鍵術語
8.8 練習
第9章 使用iDA建立神經網路
9.1 反向傳播學習的4步法
9.2 神經網路聚類4步法
9.3 使用ESX進行神經網路簇分析
9.4 本章小結
9.5 關鍵術語
9.6 練習
第10章 統計技術
10.1 線性回歸分析
10.2 對數回歸
10.3 貝葉斯分類器
10.4 聚類算法
10.5 啟發式的還是統計的
10.6 本章小結
10.7 關鍵術語
10.8 練習
第11章 專門技術
11.1 時間序列分析
11.2 挖掘Web
11.3 挖掘文本數據
11.4 改進性能
11.5 本章小結
11.6 關鍵術語
11.7 練習
第IV部分 智慧型系統
第12章 基於規則的系統
12.1 探索人工智慧
12.2 狀態空間搜尋的問題求解
12.3 專家系統
12.4 構造基於規則的系統
12.5 本章小結
12.6 關鍵術語
12.7 練習
第13章 基於規則的系統中不確定性的管理
13.1 不確定性:來源和解決方案
13.2 基於規則的模糊系統
13.3 不確定性的基於機率的方法
13.4 本章小結
13.5 關鍵術語
13.6 練習
第14章 智慧型代理
14.1 智慧型代理的特徵
14.2 智慧型代理的分類
14.3 整合數據挖掘、專家系統和智慧型代理
14.4 本章小結
14.5 關鍵術語
14.6 練習
附錄A iDA軟體
A.1 軟體安裝
A.2 卸載iDA
A.3 軟體局限性
A.4 軟體使用指南
A.5 故障檢測
A.6 軟體支持
附錄B 數據挖掘數據集
B.1 iDA數據集包
B.2 所要挖掘的數據集所在的Web站點
附錄C 決策樹屬性選取
附錄D 性能評估的統計
D.1 單位匯總統計
D.2 常態分配
D.3 比較有指導學習模型
D.4 數值輸出的置信區間
D.5 比較具有數值輸出的模型
附錄E Excel數據透視表:Office 97
E.1 創建簡單數據透視表
E.2 假設檢驗的數據透視表
E.3 創建多維數據透視圖
文摘
插圖:
序言
《數據挖掘教程》一書出版發行以來,承蒙讀者厚愛,很多學校選用此書作為教材,並不斷來郵件和電話反饋使用過程中的一些建議和問題。此次再版,北京聯合大學套用文理學院的戴老師和我一起,匯總了讀者的建議和我們自己在教學過程中的一些體會,對全書進行了修訂,改正第一版翻譯過程中不確切的地方;戴老師對書中的例子又進行了一遍驗證,更正了原書中的一些錯誤。
希望此書再版給各位讀者在學習和教學過程中帶來更大的幫助。在此也特別感謝在使用過程中給我們反饋的各位讀者。
希望此書再版給各位讀者在學習和教學過程中帶來更大的幫助。在此也特別感謝在使用過程中給我們反饋的各位讀者。