高維聚類知識發現關鍵技術研究及套用

高維聚類知識發現關鍵技術研究及套用

《高維聚類知識發現關鍵技術研究及套用》是2009年由電子工業出版社出版的圖書,作者是陳建斌。

基本介紹

  • 書名:高維聚類知識發現關鍵技術研究及套用
  • 作者:陳建斌
  • ISBN:9787121082481
  • 定價:26.00 元
  • 出版社:電子工業出版社
  • 出版時間:2009
  • 開本:32
內容簡介,作者簡介,圖書目錄,

內容簡介

知識發現是從數據集中抽取和精化新的模式的過程,基於資料庫的知識發現(KnowledgeDiscoveryinDatabase,KDD)是知識發現研究的主體和熱點。本書在討論高維數據相似性尤其是高維二元數據相似性定義的基礎上,提出了基於粗圖模型的硬聚類和軟聚類算法、高維二元數據的映射聚類算法、基於螞蟻行為的聚類算法等,並進一步提出基於映射聚類的離群點檢測方法;還特別討論了高維聚類結果的表示方法問題,提出了套用粗糙集高效表達聚類結果的方法;最後探討了聚類知識發現數據建模的基本步驟,給出了聚類知識發現的典型套用案例。

作者簡介

陳建斌,男,山西長治人。2005年獲計算機套用專業博士學位。國家職業技能鑑定專家委員會企業信息管理專家組組長,中國機械工業企業管理協會專家委員會委員,北京聯合大學商務學院副教授、電子商務研究所所長,高級企業信息管理師。主要研究方向為企業信息化管理與運作、電子商務與電子政務和商務智慧型。作者多年來秉承系統工程思想,開展企業信息化管理的研究與實踐,主編了《企業信息管理師培訓教程》、《ERP工程師培訓教程》、《電子商務與電子政務》、《電子商務與現代物流》和《信息經濟學》等多部著作,參與國家自然科學基金項目多項,主持省部級科研項目多項,在國核心心期刊及國際學術會議上發表論文三十餘篇。作為高級顧問和專家組組長,主講和輔導中央企業信息管理師職業資格培訓數十期;參與多項企業信息化戰略規劃,數據倉庫規劃與建設和企業診斷等項目。

圖書目錄

第1章知識發現與KDD
1.1知識與知識發現
1.1.1知識
1.1.2知識發現和KDD
1.1.3知識發現的過程
1.2資料庫知識發現——KDD
1.2.1KDD的產生與發展
1.2.2KDD的一般機理和理論基礎
1.2.3KDD系統的基本框架
1.2.4KDD的主要任務
第2章聚類知識發現及其關鍵技術
2.1聚類問題的主要方法
2.2聚類問題的關鍵技術
2.2.1數據倉庫技術
2.2.2高維聚類技術
2.3高維聚類關鍵技術研究
2.3.1高維聚類的主要算法
2.3.2高維聚類算法的關鍵技術
第3章高維數據相似性的定義
3.1數據相似關係
3.1.1基於距離的相似性定義
3.1.2基於密度的相似性定義
3.1.3基於連線的相似性定義
3.2高維數據相似關係的定義
3.3二元數據相似性的定義
3.3.1屬性分布特徵向量
3.3.2對象間屬性分布相似性
3.4小結
第4章基於粗圖模型的聚類算法
4.1圖論基礎概念
4.2基於圖論的聚類算法
4.2.1聚集型圖論聚類
4.2.2多層粗圖法
4.2.3基於二部圖的方法
4.3圖劃分的關鍵技術
4.3.1圖的多層二分劃(MultilevelGraphBisection)
4.3.2增強譜分割算法
4.3.3圖的非平衡劃分技術
4.4多層粗圖聚類算法的改進
4.4.1聚類算法
4.4.2圖分割的精化算法
4.4.3聚類質量評價
4.4.4實驗結果
4.4.5算法評價
4.5基於粗圖模型的軟聚類方法
4.5.1引言
4.5.2軟聚類算法
4.5.3基於圖劃分法的軟聚類GPSC算法
4.5.4實驗分析
4.5.5軟聚類方法的評價
4.6小結
第5章高維二元數據的映射聚類算法
5.1引言
5.2二元數據
5.3映射聚類模型
5.3.1伯努利分布(Bernoullidistribution)
5.3.2有限混合伯努利分布
5.3.3似然函式
5.3.4EM算法
5.3.5伯努利混合模型的EM算法
5.3.6基於混合模型的映射聚類思想
5.4映射聚類算法
5.5實驗結果
5.6小結
第6章基於螞蟻行為的聚類方法
6.1螞蟻算法綜述
6.2Deneubourg基本模型及LF聚類算法
6.2.1數據對象表示方法及相似性量度
6.2.2Deneubourg基本模型
6.2.3LF聚類算法
6.3基於密度的啟發性群體智慧型聚類算法——HDBCSI
6.3.1記憶體
6.3.2基於密度的先行策略
6.3.3基於密度的啟發性群體智慧型聚類算法HDBCSI算法描述
6.3.4算法測試與比較分析
6.3.5螞蟻算法評價
6.4小結
第7章高維數據空間的離群點檢測方法
7.1概述
7.2高維空間中的離群點發現
7.3子空間離群點發現算法綜述
7.4映射離群點發現的思考
7.5映射離群點發現算法的設計
7.5.1映射聚類算法
7.5.2基於熵的屬性選擇
7.5.3離散屬性中離群點的確定
7.5.4簇外屬性檢測
7.6算法描述及分析
7.7小結
第8章高維數據聚類結果的表示
8.1聚類結果表示方式概述
8.1.1數據可視化
8.1.2表達式法
8.2基於粗糙集理論的知識表示
8.2.1粗糙集基礎理論
8.2.2屬性空間上的rough集理論
8.3基於粗糙集理論的聚類結果表達
8.3.1一般聚類知識的表達
8.3.2高維二元映射聚類結果的粗糙集表示
8.4小結
第9章聚類知識發現數據建模及套用
9.1數據模型的建立
9.1.1數據倉庫的體系結構與建模方法
9.1.2多維數據模型對分析型套用的支持
9.1.3數據建模方案
9.2套用數據準備
9.2.1數據準備的內容
9.2.2數據淨化的方法
9.2.3數據的精簡
9.3聚類知識發現的套用——電信市場客戶分群
9.3.1客戶聚類分析流程
9.3.2戰術分群與目標市場行銷
9.4小結
參考文獻
……

相關詞條

熱門詞條

聯絡我們