基本介紹
- 中文名:知識發現(第二版)
- 作者:史忠植
- 出版社:清華大學出版社
- 出版時間:2011年01月01日
- 定價:59 元
- 裝幀:平裝
- ISBN:9787302239574
內容簡介,目錄,
內容簡介
本書全面而又系統地介紹了知識發現的方法和技術,反映了當前知識發現研究的最新成果和進展。全書共分15章。第1章是緒論,概述知識發現的重要概念和發展過程。下面三章重點討論分類問題,包括決策樹、支持向量機和遷移學習。第5章闡述聚類分析。第6章是關聯規則。第7章討論粗糙集和粒度計算。第8章介紹神經網路,書中著重介紹幾種實用的算法。第9章探討貝葉斯網路。第10章討論隱馬爾可夫模型。第11章探討圖挖掘。第12章討論進化計算和遺傳算法。第13章探討分散式知識發現,它使海量數據挖掘成為可能。最後兩章以Web知識發現、認知神經科學為例,介紹知識發現的套用。
目錄
第1章緒論
1.1知識
1.2知識發現的過程
1.3知識發現的任務
1.4知識發現的方法
1.4.1統計方法
1.4.2機器學習
1.4.3神經計算
1.4.4可視化
1.5知識發現的對象
1.5.1資料庫
1.5.2文本
1.5.3Web信息
1.5.4空間數據
1.5.5圖像和視頻數據
1.6知識發現系統
第2章決策樹
2.1歸納學習
2.2決策樹學習
2.3CLS學習算法
2.4ID3學習算法
2.4.1資訊理論簡介
2.4.2資訊理論在決策樹學習中的意義及套用
2.4.3ID3算法
2.4.4ID3算法套用舉例
2.4.5C4.5算法
2.5決策樹的改進算法
2.5.1二叉樹判定算法
2.5.2按信息比值進行估計的方法
2.5.3按分類信息估值
2.5.4按劃分距離估值的方法
2.6決策樹的評價
2.7簡化決策樹
2.7.1簡化決策樹的動機
2.7.2決策樹過大的原因
2.7.3控制樹的大小
2.7.4修改測試屬性空間
2.7.5改進測試屬性選擇方法
2.7.6對數據進行限制
2.7.7改變數據結構
2.8連續性屬性離散化
2.9基於偏置變換的決策樹學習算法BSDT
2.9.1偏置的形式化
2.9.2表示偏置變換
2.9.3算法描述
2.9.4過程偏置變換
2.9.5基於偏置變換的決策樹學習算法BSDT...
2.9.6經典案例庫維護算法TCBM
2.9.7偏置特徵抽取算法
2.9.8改進的決策樹生成算法GSD
2.9.9實驗結果
2.10單變數決策樹的並行處理
2.10.1並行決策樹算法
2.10.2串列算法的並行化
2.11歸納學習中的問題
第3章支持向量機
3.1統計學習問題
3.1.1經驗風險
3.1.2VC維
3.2學習過程的一致性
3.2.1學習過程一致性的經典定義
3.2.2學習理論的重要定理
3.2.3VC熵
3.3結構風險最小歸納原理
3.4支持向量機
3.4.1線性可分
3.4.2線性不可分
3.5核函式
3.5.1多項式核函式
3.5.2徑向基函式
3.5.3多層感知機
3.5.4動態核函式
3.6鄰近支持向量機
3.7極端支持向量機
第4章遷移學習
4.1概述
4.2相似性關係
4.2.1語義相似性
4.2.2結構相似性
4.2.3樣本相似性
4.2.4相似性計算
4.3歸納遷移學習
4.3.1基於採樣的歸納遷移
4.3.2基於特徵的歸納遷移
4.3.3基於參數的歸納遷移
4.4推導遷移學習
4.4.1基於採樣的知識遷移
4.4.2基於特徵的知識遷移
4.5主動遷移學習
4.5.1主動學習
4.5.2主動遷移學習算法
4.5.3遷移學習分類器
4.5.4決策函式
4.6多源領域知識的遷移學習
4.7強化學習中的遷移
4.7.1行為遷移
4.7.2知識遷移
第5章聚類分析
5.1概述
5.2相似性度量
5.2.1相似係數
5.2.2屬性的相似度量
5.3劃分方法
5.3.1k均值算法
5.3.2k中心點算法
5.3.3大型資料庫的劃分方法
5.4層次聚類方法
5.4.1BIRCH算法
5.4.2CURE算法
5.4.3ROCK算法
5.5基於密度的聚類
5.6基於格線方法
5.7基於模型方法
5.8模糊聚類
5.8.1傳遞閉包法
5.8.2動態直接聚類法
5.8.3最大樹法
5.9蟻群聚類方法
5.9.1基本模型
5.9.2LF算法
5.9.3基於群體智慧型的聚類算法CSI
5.9.4混合聚類算法CSIM
5.10聚類方法的評價
第6章關聯規則
6.1概述
6.2基本概念
6.3二值型關聯規則挖掘
6.3.1AIS算法
6.3.2SETM算法
6.3.3Apriori算法
6.3.4Apriori算法的改進
6.4頻繁模式樹挖掘算法
6.5垂直挖掘算法
6.6挖掘關聯規則的數組方法
6.7頻繁閉項集的挖掘算法
6.8最大頻繁項集挖掘算法
6.9增量式關聯規則挖掘
6.10模糊關聯規則的挖掘
6.11任意多表間關聯規則的並行挖掘
6.11.1問題的形式描述
6.11.2單表內大項集的並行計算
6.11.3任意多表間大項集的生成
6.11.4跨表間關聯規則的提取
6.12基於分散式系統的關聯規則挖掘算法
6.12.1候選集的生成
6.12.2候選數據集的本地剪枝
6.12.3候選數據集的全局剪枝
6.12.4合計數輪流檢測
6.12.5分散式挖掘關聯規則的算法
第7章粗糙集
7.1概述
7.1.1知識的分類觀點
7.1.2新型的隸屬關係
7.1.3概念的邊界觀點
7.2知識的約簡
7.2.1一般約簡
7.2.2相對約簡
7.2.3知識的依賴性
7.3決策表的約簡
7.3.1屬性的依賴性
7.3.2一致決策表的約簡
7.3.3非一致決策表的約簡
7.4粗糙集的擴展模型
7.4.1可變精度粗糙集模型
7.4.2相似模型
7.4.3基於粗糙集的非單調邏輯
7.4.4與其他數學工具的結合
7.5粗糙集的實驗系統
7.6粒度計算
7.6.1模糊集模型
7.6.2粗糙集模型
7.6.3商空間理論模型
7.6.4相容粒度空間模型
第8章神經網路
8.1概述
8.1.1基本的神經網路模型
8.1.2神經網路的學習方法
8.2人工神經元及感知機模型
8.2.1基本神經元
8.2.2感知機模型
8.3前向神經網路
8.3.1前向神經網路模型
8.3.2多層前向神經網路的誤差反向傳播(BP)算法
8.3.3BP算法的若干改進
8.4徑向基函式神經網路
8.4.1插值問題
8.4.2正則化問題
8.4.3RBF網路學習方法
8.5反饋神經網路
8.5.1離散型Hopfield網路
8.5.2連續型Hopfield網路
8.5.3Hopfield網路套用
8.5.4雙向聯想記憶模型
8.6隨機神經網路
8.6.1模擬退火算法
8.6.2玻爾茲曼機
8.7自組織特徵映射神經網路
8.7.1網路的拓撲結構
8.7.2網路自組織算法
8.7.3監督學習
第9章貝葉斯網路
9.1概述
9.1.1貝葉斯網路的發展歷史
9.1.2貝葉斯方法的基本觀點
9.1.3貝葉斯網路在數據挖掘中的套用
9.2貝葉斯機率基礎
9.2.1機率論基礎
9.2.2貝葉斯機率
9.3貝葉斯學習理論
9.3.1幾種常用的先驗分布選取方法
9.3.2計算學習機制
9.3.3貝葉斯問題求解
9.4簡單貝葉斯學習模型
9.4.1簡單貝葉斯模型
9.4.2簡單貝葉斯模型的提升
9.4.3提升簡單貝葉斯分類的計算複雜性
9.5貝葉斯網路的建造
9.5.1貝葉斯網路的結構及建立方法
9.5.2學習貝葉斯網路的機率分布
9.5.3學習貝葉斯網路的網路結構
9.6貝葉斯潛在語義模型
9.7半監督文本挖掘算法
9.7.1網頁聚類
9.7.2對含有潛在類別主題詞的文檔的類別標註
9.7.3基於簡單貝葉斯模型學習標註和未標註樣本
第10章隱馬爾可夫模型
10.1馬爾可夫過程
10.2隱馬爾可夫模型
10.3評估問題
10.3.1前向算法
10.3.2後向算法
10.4Viterbi算法
10.5學習算法
10.6嵌入式隱馬爾可夫模型
10.7基於狀態駐留時間的分段機率模型
第11章圖挖掘
11.1概述
11.2圖的基礎知識
11.2.1圖同構
11.2.2頻繁子圖
11.3頻繁子圖挖掘
11.3.1基於Apriori的算法
11.3.2基於模式增長的算法
11.4約束圖模式挖掘
11.4.1特殊的子圖挖掘
11.4.2基於約束的子結構模式挖掘
11.5圖分類
11.5.1基於核的圖分類方法
11.5.2最優核矩陣學習
11.5.3組合維核方法
11.6圖模型
11.7圖像標註模型
11.7.1混合生成式和判別式模型的圖像語義標註框架
11.7.2構造集群分類器鏈
11.8社會網路分析
11.8.1中心度分析
11.8.2子群分析
11.8.3社會網路分析的套用
11.8.4社會網路分析軟體
第12章進化計算
12.1概述
12.2進化系統理論的形式模型
12.3達爾文進化算法
12.4基本遺傳算法
12.4.1基本遺傳算法的構成要素
12.4.2基本遺傳算法的一般框架
12.5遺傳算法的數學理論
12.5.1模式定理
12.5.2積木塊假設
12.5.3隱並行性
12.6遺傳算法編碼方法
12.6.1二進制編碼方法
12.6.2格雷碼編碼方法
12.6.3浮點數編碼方法
12.6.4符號編碼方法
12.6.5多參數級聯編碼方法
12.6.6多參數雜交編碼方法
12.7適應度函式
12.8遺傳操作
12.8.1選擇運算元
12.8.2雜交運算元
12.8.3變異運算元
12.8.4反轉操作
12.9變長度染色體遺傳算法
12.10小生境遺傳算法
12.11混合遺傳算法
12.12並行遺傳算法
12.13分類器系統
第13章分散式知識發現
13.1概述
13.2分散式計算技術
13.3同構海量數據挖掘
13.4異構海量數據挖掘
13.5任務調度
13.6基於主體的分散式知識發現
13.7基於格線的分散式知識發現
13.7.1KnowledgeGrid
13.7.2Weka4WS
13.7.3DataMiningGrid
13.7.4GridMiner
13.8面向服務的分散式知識發現
13.8.1SODDM
13.8.2Anteater
13.9基於對等網的分散式知識發現
13.10基於雲平台的分散式知識發現
第14章Web知識發現
14.1概述
14.2Web知識發現的任務
14.2.1Web內容挖掘
14.2.2Web結構挖掘
14.2.3Web使用挖掘
14.3Web知識發現方法
14.3.1文本的特徵表示
14.3.2TFIDF向量表示法
14.3.3特徵子集的選取
14.4模型質量評價
14.5基於文本挖掘的漢語詞性自動標註研究
14.6文本分類
14.7文本聚類
14.7.1層次凝聚法
14.7.2平面劃分法
14.7.3簡單貝葉斯聚類算法
14.7.4k近鄰聚類算法
14.7.5分級聚類
14.7.6基於概念的文本聚類
14.8文本摘要
14.9Web主題建模
14.10用戶興趣挖掘
第15章認知神經科學知識發現
15.1概述
15.2腦功能成像分析
15.3同步振盪
15.4特徵捆綁
15.4.1帶噪聲的神經元發放方式
15.4.2神經元輸入的貝葉斯耦合方式
15.4.3神經元之間的競爭關係
15.5神經元集群仿真
參考文獻