XML挖掘:聚類分類與信息提取

XML挖掘:聚類分類與信息提取

《XML挖掘:聚類分類與信息提取》是2012年浙江大學出版社出版的圖書,作者是潘有能。

基本介紹

  • 書名:XML挖掘:聚類分類與信息提取
  • 作者:潘有能
  • 出版社:浙江大學出版社
  • 出版時間:2012年7月1日
  • 頁數:152 頁
  • 定價:32.00
  • 開本:16 開
  • ISBN:9787308102544  
  • 類型:計算機與網際網路
  • 語種:簡體中文
內容簡介,圖書目錄,作者簡介,

內容簡介

《XML挖掘:聚類、分類與信息提取》內容分為8章,第1章先對XML和數據挖掘技術作簡要介紹。在對XML文檔進行挖掘之前,需要先進行文檔解析及文檔標記消歧,即為第2章的內容。第3章和第4章分別介紹XML挖掘的兩項主要功能:聚類與分類。和HTML中的超連結一樣,XML文檔之間也具有連結性,第5章介紹利用連結挖掘XML文檔間結構的方法。針對XML文檔的查詢、檢索以及信息提取有利於用戶準確、快速、有效地利用XML文檔,本書的第6章即討論XML查詢與信息提取技術;第7章和第8章則介紹基於XML數據挖掘建模、知識表示以及Web日誌挖掘。
XML自發布之日起就以其良好的可擴展性受到業界的普遍歡迎和支持,逐漸成為Web上的通用語言,在數據交換、Web服務、內容管理、Web集成等方面得到了重要套用。隨著XML套用的日益廣泛,XML文檔的內容和XML文檔之間的關係結構也日趨複雜。數據挖掘是當前信息科學的研究熱點之一,用於從資料庫、數據倉庫或其他信息庫的大量數據中提取有用信息。將聚類、分類與信息提取等數據挖掘技術套用於XML中有利於網路信息資源的蒐集、整理及檢索,為基於XML的數據交換和電子商務提供支持。國內尚無XML挖掘方面的圖書,而只有數據挖掘或是XML技術方面的相關書籍,且均為當前計算機科學、信息科學領域的熱點。《XML挖掘:聚類、分類與信息提取》將聚類、分類與信息提取等數據挖掘技術套用到Web2.0及下一代網際網路的基礎技術—XML中,但可以增強網路中XML文檔的組織性,從而為網路信息資源的蒐集、整理及檢索利用提供良好的技術支持,還可以在海量網路信息中發現XML文檔間隱含的知識,確定XML文檔內部標記的真實語義信息,為本體論和語義網的發展奠定堅實基礎。

圖書目錄

第1章 XML與數據挖掘概述
1.1 XML
1.2 數據挖掘概述
第2章 XML數據預處理
2.1 XML文檔解析
2.2 XML文檔標記語義消歧
第3章 XML聚類
3.1 XML聚類概述
3.2 XML文檔相似度計算
3.3 XML文檔聚類
第4章 XML分類
4.1 相關定義
4.2 權重計算
4.3 相似性計算
4.4 XML文檔分類
第5章 XML文檔間結構挖掘
5.1 XML連結
5.2 Web結構挖掘算法
5.3 基於XML連結的文檔間結構挖掘
第6章 XML查詢與信息提取
6.1 XML查詢語言
6.2 特徵提取
6.3 主題提取
6.4 自動摘要
第7章 基於XML的數據挖掘建模和知識表示
7.1 基於XML的數據挖掘建模
7.2 基於XML的知識表示
第8章 基於XML的Web使用挖掘
8.1 基於XML的Web使用挖掘體系結構
8.2 XGMML
8.3 LOGML文檔的結構
8.4 LOGML文檔的生成
8.5 基於LOGML的數據挖掘
附錄一:基於語義的XML文檔相似度計算源程式
附錄二:XML文檔聚類算法源程式
參考文獻

作者簡介

潘有能,男,浙江大學副教授潘,湖南醴陵人。浙江大學公共管理學院信息資源管理系副教授。1995年考入南京大學信息管理系,先後獲文學學士和管理學博士學位。2004年到浙江大學任教。在核心期刊上發表論文十餘篇,參加多項國家自然科學基金和省部級項目。
本科生課程:社科信息檢索、信息存儲與保護技術、信息處理技術、電子政務導論、電子政務實務、管理信息系統、電子政務、網頁設計與製作、數據倉庫與數據挖掘
研究生課程:信息檢索技術、數據挖掘技術
研究項目 ·基於XML的Web日誌挖掘研究 浙江大學“曙光”項目2005-04-01 ·基於本體論的語義Web研究 浙江省教育廳2005-07-01
主要論文
·XML文檔自動聚類研究 情報學報2006-04-24 ·基於標記樹的XML文檔自動分類研究 情報學報2007-7-24 ·圖書館學學科知識地圖的構建 大學圖書館學報2007-7-1 ·web信息技術教程 編著或教材智慧財產權出版社2007-07-01 潘有能、葉鷹

相關詞條

熱門詞條

聯絡我們