XML挖掘：聚類分類與信息提取

內容簡介

《XML挖掘:聚類、分類與信息提取》內容分為8章，第1章先對XML和數據挖掘技術作簡要介紹。在對XML文檔進行挖掘之前，需要先進行文檔解析及文檔標記消歧，即為第2章的內容。第3章和第4章分別介紹XML挖掘的兩項主要功能：聚類與分類。和HTML中的超連結一樣，XML文檔之間也具有連結性，第5章介紹利用連結挖掘XML文檔間結構的方法。針對XML文檔的查詢、檢索以及信息提取有利於用戶準確、快速、有效地利用XML文檔，本書的第6章即討論XML查詢與信息提取技術；第7章和第8章則介紹基於XML數據挖掘建模、知識表示以及Web日誌挖掘。

XML自發布之日起就以其良好的可擴展性受到業界的普遍歡迎和支持，逐漸成為Web上的通用語言，在數據交換、Web服務、內容管理、Web集成等方面得到了重要套用。隨著XML套用的日益廣泛，XML文檔的內容和XML文檔之間的關係結構也日趨複雜。數據挖掘是當前信息科學的研究熱點之一，用於從資料庫、數據倉庫或其他信息庫的大量數據中提取有用信息。將聚類、分類與信息提取等數據挖掘技術套用於XML中有利於網路信息資源的蒐集、整理及檢索，為基於XML的數據交換和電子商務提供支持。國內尚無XML挖掘方面的圖書，而只有數據挖掘或是XML技術方面的相關書籍，且均為當前計算機科學、信息科學領域的熱點。《XML挖掘:聚類、分類與信息提取》將聚類、分類與信息提取等數據挖掘技術套用到Web2.0及下一代網際網路的基礎技術—XML中，但可以增強網路中XML文檔的組織性，從而為網路信息資源的蒐集、整理及檢索利用提供良好的技術支持，還可以在海量網路信息中發現XML文檔間隱含的知識，確定XML文檔內部標記的真實語義信息，為本體論和語義網的發展奠定堅實基礎。

圖書目錄

第1章 XML與數據挖掘概述

1.1 XML

1.2 數據挖掘概述

第2章 XML數據預處理

2.1 XML文檔解析

2.2 XML文檔標記語義消歧

第3章 XML聚類

3.1 XML聚類概述

3.2 XML文檔相似度計算

3.3 XML文檔聚類

第4章 XML分類

4.1 相關定義

4.2 權重計算

4.3 相似性計算

4.4 XML文檔分類

第5章 XML文檔間結構挖掘

5.1 XML連結

5.2 Web結構挖掘算法

5.3 基於XML連結的文檔間結構挖掘

第6章 XML查詢與信息提取

6.1 XML查詢語言

6.2 特徵提取

6.3 主題提取

6.4 自動摘要

第7章基於XML的數據挖掘建模和知識表示

7.1 基於XML的數據挖掘建模

7.2 基於XML的知識表示

XML挖掘：聚類分類與信息提取

基本介紹

內容簡介

圖書目錄

作者簡介

相關詞條

熱門詞條