《不確定圖數據挖掘》是2013年哈爾濱工業大學出版社出版的圖書。
基本介紹
- ISBN:9787560337838
- 頁數:225
- 定價:48.00元
- 出版社:哈爾濱工業大學出版社
- 出版時間:2013-1
內容介紹,目錄&節選,編輯推薦,目錄,文摘,
內容介紹
《不確定圖數據挖掘》的內容建立在圖論、機率論、計算複雜性理論、數據挖掘和算法等理論和技術的基礎上,因此需要讀者具備上述理論和技術的基礎知識。書中的論述基於嚴格的數學證明,除一些特殊情況外,所有定理給出了完整的數學證明。同時,為了讀者更容易理解《不確定圖數據挖掘》中的概念、定理和算法書。
目錄&節選
編輯推薦
《不確定圖數據挖掘》對作者在不確定圖數據挖掘領域取得的研究成果進行了全面的梳理和總結,從數據模型、問題語義、計算複雜性和算法幾方面系統介紹了不確定圖數據挖掘,力圖為研究人員提供一個了解不確定圖數據挖掘的嚴謹、易懂的學術讀物。
目錄
第1章 不確定圖數據挖掘概述
1.1 不確定圖數據的產生
1.2 不確定圖數據挖掘的概念
1.3 不確定圖數據挖掘面臨的挑戰
1.4 不確定圖數據挖掘的研究內容
1.4.1 不確定圖數據模型
1.4.2 不確定圖數據挖掘問題的語義
1.4.3 不確定圖數據挖掘問題的計算複雜性
1.4.4 不確定圖數據挖掘算法
1.4.5 不確定圖數據挖掘的套用
第2章 不確定圖數據模型
2.1 確定圖
2.2 不確定圖
2.2.1 不確定圖的形式化表示
2.2.2 不確定圖的語義
2.3 不確定圖資料庫
2.3.1 不確定圖資料庫的形式化表示
2.3.2 不確定圖資料庫的語義
2.4 不確定圖數據模型的擴展
第3章 不確定圖數據挖掘問題的語義
3.1 確定圖數據挖掘問題的語義
3.2 不確定圖數據挖掘問題的語義
第4章 期望頻繁子圖模式挖掘
4.1 確定圖數據上的頻繁子圖模式挖掘
4.2 問題定義
4.3 計算複雜性
4.3.1 #P複雜性類
4.3.2 期望頻繁子圖模式挖掘問題的計算複雜性
4.3.3 期望支持度計算的複雜性
4.4 子圖模式的表示方法
4.5 近似挖掘算法
4.5.1 問題鬆弛
4.5.2 算法概述
4.5.3 期望支持度的計算算法
4.5.4 DFS編碼樹的最佳化裁剪方法
4.5.5 完整算法
第5章 機率頻繁子圖模式挖掘
5.1 問題定義
5.2 計算複雜性
5.2.1 機率頻繁子圖模式挖掘問題的計算複雜性
5.2.2 φ-頻繁機率計算的複雜性
5.3 近似挖掘算法
5.3.1 算法概述
5.3.2 計算φ-頻繁機率近似區間的算法
5.3.3 完整算法
5.3.4 參數設定方法
5.3.5 算法最佳化
5.4 頻繁子圖模式挖掘語義的區別
5.4.1 數學分析
5.4.2 實驗分析
第6章 TOP-K極大團挖掘
6.1問題定義
6.2 計算複雜性
6.3 計算極大團機率的算法
6.4 分支限界挖掘算法
6.4.1 基本分支限界算法
6.4.2 最佳化裁剪規則
6.4.3 兩階段分支限界搜尋
6.5預處理方法
6.5.1 基於頂點度的過濾
6.5.2 初始化臨時topk結果
6.6 極大團挖掘算法在蛋白質複合體預測中的套用
6.6.1 基於topk極大團挖掘的蛋白質複合體預測算法
6.6.2 實驗對比
第7章 緊密頂點子集挖掘
7.1 問題定義
7.2 最緊密頂點子集挖掘算法
7.3 topk緊密頂點子集挖掘算法
7.3.1 Lawler方法
7.3.2 挖掘算法
1.1 不確定圖數據的產生
1.2 不確定圖數據挖掘的概念
1.3 不確定圖數據挖掘面臨的挑戰
1.4 不確定圖數據挖掘的研究內容
1.4.1 不確定圖數據模型
1.4.2 不確定圖數據挖掘問題的語義
1.4.3 不確定圖數據挖掘問題的計算複雜性
1.4.4 不確定圖數據挖掘算法
1.4.5 不確定圖數據挖掘的套用
第2章 不確定圖數據模型
2.1 確定圖
2.2 不確定圖
2.2.1 不確定圖的形式化表示
2.2.2 不確定圖的語義
2.3 不確定圖資料庫
2.3.1 不確定圖資料庫的形式化表示
2.3.2 不確定圖資料庫的語義
2.4 不確定圖數據模型的擴展
第3章 不確定圖數據挖掘問題的語義
3.1 確定圖數據挖掘問題的語義
3.2 不確定圖數據挖掘問題的語義
第4章 期望頻繁子圖模式挖掘
4.1 確定圖數據上的頻繁子圖模式挖掘
4.2 問題定義
4.3 計算複雜性
4.3.1 #P複雜性類
4.3.2 期望頻繁子圖模式挖掘問題的計算複雜性
4.3.3 期望支持度計算的複雜性
4.4 子圖模式的表示方法
4.5 近似挖掘算法
4.5.1 問題鬆弛
4.5.2 算法概述
4.5.3 期望支持度的計算算法
4.5.4 DFS編碼樹的最佳化裁剪方法
4.5.5 完整算法
第5章 機率頻繁子圖模式挖掘
5.1 問題定義
5.2 計算複雜性
5.2.1 機率頻繁子圖模式挖掘問題的計算複雜性
5.2.2 φ-頻繁機率計算的複雜性
5.3 近似挖掘算法
5.3.1 算法概述
5.3.2 計算φ-頻繁機率近似區間的算法
5.3.3 完整算法
5.3.4 參數設定方法
5.3.5 算法最佳化
5.4 頻繁子圖模式挖掘語義的區別
5.4.1 數學分析
5.4.2 實驗分析
第6章 TOP-K極大團挖掘
6.1問題定義
6.2 計算複雜性
6.3 計算極大團機率的算法
6.4 分支限界挖掘算法
6.4.1 基本分支限界算法
6.4.2 最佳化裁剪規則
6.4.3 兩階段分支限界搜尋
6.5預處理方法
6.5.1 基於頂點度的過濾
6.5.2 初始化臨時topk結果
6.6 極大團挖掘算法在蛋白質複合體預測中的套用
6.6.1 基於topk極大團挖掘的蛋白質複合體預測算法
6.6.2 實驗對比
第7章 緊密頂點子集挖掘
7.1 問題定義
7.2 最緊密頂點子集挖掘算法
7.3 topk緊密頂點子集挖掘算法
7.3.1 Lawler方法
7.3.2 挖掘算法
文摘
由於真實物理世界中的網路普遍具有不確定性,因此網路可以表示為不確定圖。Jin等使用數據挖掘方法研究了如何從不確定圖中挖掘連通可靠性高於某閾值的全部導出子圖。該問題在蛋白質複合體發現、通信網路路由和社會網路分析中具有重要套用。由於該問題是對兩節點間連通可靠性計算問題和全網連通可靠性計算問題的推廣,因此其計算複雜性至少屬於#P完全複雜性類。為解決該問題,文獻中提出了一種新的採樣方法,並將核心挖掘問題轉化為確定圖上的頻繁可達頂點集(frequent cohesive sets)發現問題。作者將挖掘極大集合的切削(peeling)技術與導出子圖枚舉的深度優先搜尋技術相結合,提出了一種高效的兩階段挖掘算法。
4.聚類算法
圖聚類(graph clustering)問題在生物信息學、物理學和社會網路等領域中具有廣泛套用,現已被廣泛研究。圖聚類問題與稠密子圖挖掘問題不同:在稠密子圖挖掘中,人們只關心頂點子集的導出子圖是否稠密;而在圖聚類問題中,人們關心的是如何將圖的頂點集劃分成若干子集,使得每個頂點子集內部的連線密度比這組頂點與其他頂點之間的連線密度要大。
針對大規模圖數據中普遍存在的不確定性,Kollios等研究了不確定圖聚類問題,即給定一個不確定圖和一個確定圖聚類目標函式,如何將不確定圖的頂點集合快速劃分成若干互不相交的子集(即聚類),使該聚類在不確定圖的所有可能世界上的聚類目標函式的期望值最大。文獻提出了基於編輯距離(edit distance)的圖聚類函式,並將該聚類問題與相關聚類(correlation clustering)問題聯繫起來,並最終提出了具有性能保證的近似算法。
4.聚類算法
圖聚類(graph clustering)問題在生物信息學、物理學和社會網路等領域中具有廣泛套用,現已被廣泛研究。圖聚類問題與稠密子圖挖掘問題不同:在稠密子圖挖掘中,人們只關心頂點子集的導出子圖是否稠密;而在圖聚類問題中,人們關心的是如何將圖的頂點集劃分成若干子集,使得每個頂點子集內部的連線密度比這組頂點與其他頂點之間的連線密度要大。
針對大規模圖數據中普遍存在的不確定性,Kollios等研究了不確定圖聚類問題,即給定一個不確定圖和一個確定圖聚類目標函式,如何將不確定圖的頂點集合快速劃分成若干互不相交的子集(即聚類),使該聚類在不確定圖的所有可能世界上的聚類目標函式的期望值最大。文獻提出了基於編輯距離(edit distance)的圖聚類函式,並將該聚類問題與相關聚類(correlation clustering)問題聯繫起來,並最終提出了具有性能保證的近似算法。