《XML挖掘:聚類、分類與信息提取》內容簡介:XML自發布之日起就以其良好的可擴展性受到業界的普遍歡迎和支持,逐漸成為Web上的通用語言,在數據交換、Web服務、內容管理、Web集成等方面得到了重要套用。隨著XML套用的日益廣泛,XML文檔的內容和XML文檔之間的關係結構也日趨複雜。數據挖掘是當前信息科學的研究熱點之一,用於從資料庫、數據倉庫或其他信息庫的大量數據中提取有用信息。將聚類、分類與信息提取等數據挖掘技術套用於XML中有利於網路信息資源的蒐集、整理及檢索,為基於XML的數據交換和電子商務提供支持。國內目前尚無XML挖掘方面的圖書,而只有數據挖掘或是XML技術方面的相關書籍,且均為當前計算機科學、信息科學領域的熱點。《XML挖掘:聚類、分類與信息提取》將聚類、分類與信息提取等數據挖掘技術套用到Web2.0及下一代網際網路的基礎技術—XML中,但可以增強網路中XML文檔的組織性,從而為網路信息資源的蒐集、整理及檢索利用提供良好的技術支持,還可以在海量網路信息中發現XML文檔間隱含的知識,確定XML文檔內部標記的真實語義信息,為本體論和語義網的發展奠定堅實基礎。
基本介紹
- 書名:XML挖掘:聚類分類與信息提取
- 類型:計算機與網際網路
- 出版日期:2012年7月1日
- 語種:簡體中文
- ISBN:9787308102544, 7308102548
- 品牌:浙江大學出版社
- 作者:潘有能
- 出版社:浙江大學出版社
- 頁數:152頁
- 開本:16
- 定價:32.00
基本介紹
內容簡介
作者簡介
本科生課程:社科信息檢索、信息存儲與保護技術、信息處理技術、電子政務導論、電子政務實務、管理信息系統、電子政務、網頁設計與製作、數據倉庫與數據挖掘
研究生課程:信息檢索技術、數據挖掘技術編輯本段研究項目 ·基於XML的Web日誌挖掘研究 浙江大學“曙光”項目2005-04-01 ·基於本體論的語義Web研究 浙江省教育廳2005-07-01編輯本段主要論文 ·XML文檔自動聚類研究 情報學報2006-04-24 ·基於標記樹的XML文檔自動分類研究 情報學報2007-7-24 ·圖書館學學科知識地圖的構建 大學圖書館學報2007-7-1 ·web信息技術教程 編著或教材智慧財產權出版社2007-07-01 潘有能、葉鷹
圖書目錄
1.1 XML
1.2 數據挖掘概述
第2章 XML數據預處理
2.1 XML文檔解析
2.2 XML文檔標記語義消歧
第3章 XML聚類
3.1 XML聚類概述
3.2 XML文檔相似度計算
3.3 XML文檔聚類
第4章 XML分類
4.1 相關定義
4.2 權重計算
4.3 相似性計算
4.4 XML文檔分類
第5章 XML文檔間結構挖掘
5.1 XML連結
5.2 Web結構挖掘算法
5.3 基於XML連結的文檔間結構挖掘
第6章 XML查詢與信息提取
6.1 XML查詢語言
6.2 特徵提取
6.3 主題提取
6.4 自動摘要
第7章 基於XML的數據挖掘建模和知識表示
7.1 基於XML的數據挖掘建模
7.2 基於XML的知識表示
第8章 基於XML的Web使用挖掘
8.1 基於XML的Web使用挖掘體系結構
8.2 XGMML
8.3 LOGML文檔的結構
8.4 LOGML文檔的生成
8.5 基於LOGML的數據挖掘
附錄一:基於語義的XML文檔相似度計算源程式
附錄二:XML文檔聚類算法源程式
參考文獻