Web知識挖掘:理論、方法與套用

Web知識挖掘:理論、方法與套用

《Web知識挖掘:理論、方法與套用》是2010年科學出版社出版的圖書,作者是鄭慶華。本書可作為信息領域的科研與工程技術人員的參考書,也可作為計算機與相關專業的研究生和高年級本科生的教材或輔導書目。

基本介紹

  • 書名:Web知識挖掘:理論、方法與套用
  • 作者:鄭慶華
  • ISBN:7030274997, 9787030274991
  • 頁數:336頁
  • 定價:50.00元
  • 出版社:科學出版社
  • 出版時間:2010年6月1日
  • 開本:16開
  • 版次:1
  • 正文語種:簡體中文
內容簡介,圖書目錄,

內容簡介

《Web知識挖掘:理論、方法與套用》是一部關於Web知識挖掘的比較系統、完整,且理論和實踐相結合的著作,共含7章:第1章與第2章是Web知識挖掘概論,其中,第1章總體上對Web知識挖掘的現狀、概念、典型方法、套用領域以及面臨的挑戰進行綜述性說明;第2章介紹了Web知識挖掘的預備知識、分類體系、基本流程等內容。第3~6章是Web知識挖掘的理論與方法,分別論述了Web爬取、Web結構挖掘、內容挖掘、日誌挖掘相關理論與方法,並系統總結了我們自己在元數據、概念、知識元等多個層次上的知識獲取以及個性化知識服務等方面的工作。第7章是Web知識挖掘的實踐與套用實例,以實例對Web結構挖掘、日誌挖掘及內容挖掘的套用進行了說明。
《Web知識挖掘:理論、方法與套用》不僅系統地介紹了Web知識挖掘領域的基礎理論與方法,也闡述了我們在該領域的創新性工作,因而適合不同類型與層次的研究人員及學生。

圖書目錄

前言
第1章 Web挖掘概述
1.1 Web發展歷史與現狀
1.1.1 Web技術發展
1.1.2 Web上的信息爆炸
1.2 Web挖掘的概念
1.2.1 典型的Web挖掘定義
1.2.2 Web挖掘與數據挖掘、信息檢索、信息抽取的區別
1.3 Web挖掘面臨的挑戰
1.3.1 Web數據的高度複雜性
1.3.2 Web數據檢索的局限性
1.4 Web挖掘的研究方向
1.5 小結
第2章 Web挖掘的基礎知識
2.1 Web挖掘的主要預備知識
2.1.1 數據挖掘
2.1.2 文本挖掘
2.1.3 信息檢索
2.2 Web挖掘分類
2.2.1 Web數據的分類體系
2.2.2 Web挖掘分類
2.3 Web挖掘的主要套用
2.4 Web挖掘的基本流程
2.4.1 數據採集
2.4.2 數據預處理
2.4.3 模式挖掘
2.4.4 模式評估
2.5 Web挖掘領域的重要文獻、國際期刊與會議、標準規範
2.5.1 Web挖掘領域的重要文獻
2.5.2 Web挖掘相關的國際期刊與國際會議
2.5.3 Web挖掘相關的標準、規範及語言
2.6 小結
第3章 Web爬取與頁面組織管理
3.1 Web爬取概述
3.1.1 Web爬取的分類
3.1.2 Web爬取的基本原理
3.1.3 Web爬取面臨的挑戰
3.2 Web爬取中的主要技術問題
3.2.1 爬取次序
3.2.2爬取性能問題
3.2.3 爬取禮貌性問題
3.3隱含Web爬取
3.3.1 隱含Web爬蟲框架及工作機理
3.3.2表單分析與提交
3.3.3 隱含Web爬蟲實例HiWE
3.4 面向主題的Web爬取
3.4.1 主題相關度分析
3.4.2 確定下個訪問URL
3.4.3 面向主題爬取的爬蟲實例
3.5 爬取頁面的存儲與管理
3.5.1 爬取文檔的特點
3.5.2 爬取文檔的存儲方法
3.5.3爬取文檔的管理
3.6 小結
第4章 Web結構挖掘
4.1 Web結構挖掘概述
4.1.1 Web結構挖掘的分類
4.1.2 Web結構挖掘的套用
4.2 PageRank算法
4.2.1 超連結分析的假設
4.2.2 隨機衝浪(random surfing)模型
4.2.3 PageRank值的計算
4.2.4 PageRank算法的改進
4.2.5 PageRank算法在Google中的套用
4.3 HITS算法
4.3.1 HITS算法的基本思想
4.3.2 HITS算法具體過程
4.3.3 HITS算法與PageRank算法的對比
4.3.4 HITS算法改進
4.4 Hilltop算法
4.4.1 Hilltop算法基本思想
4.4.2 專家頁面選取及分值計算
4.4.3 目標頁面選取及分值計算
4.4.4 PageRank算法和Hilltop算法區別
4.4.5 Hilltop算法的缺陷
4.5 Web巨觀結構特性分析
4.5.1 Web的無尺度特性
4.5.2 Web的小世界(small world)特性
4.5.3 “蝴蝶結”和“日冕”現象
4.5.4 Web巨觀結構特性的主要套用
4.6 小結
第5章 Web內容挖掘
5.1 Web頁面的特徵表示
5.1.1 特徵表示的基本原理
5.1.2特徵的離散化
5.1.3 Web頁面特徵分析
5.1.4頁面文本建模
5.2 Web頁面分類
5.2.1 分類方法綜述
5.2.2 基於內容的網頁分類
5.3 Web頁面聚類
5.3.1 聚類方法綜述
5.3.2 基於內容的頁面聚類
5.4 面向Web的信息抽取
5.4.1 信息抽取概述
5.4.2命名實體識別
5.4.3 實體關係檢測
5.4.4 頁面元數據抽取
5.5 面向Web的本體學習
5.5.1 面向文本的本體學習概述
5.5.2 概念獲取
5.5.3 概念關係獲取
5.5.4 試驗結果與分析
5.6 面向Web的知識元及其關聯抽取
5.6.1 知識元及其關聯抽取概述
5.6.2知識元抽取
5.6.3 知識元前序關係抽取
5.7 多媒體數據挖掘
5.7.1 圖像數據的挖掘
5.7.2 視頻數據的挖掘
5.7.3 音頻數據的挖掘
5.8 Web內容挖掘的未來研究方向
5.9 小結
第6章 Web日誌挖掘
6.1 Web日誌挖掘概述
6.1.1 Web日誌挖掘的分類
6.1.2 Web日誌挖掘的典型套用
6.1.3 Web日誌挖掘的流程
6.2 Web日誌預處理
6.2.1 Web日誌數據的格式
6.2.2 Web日誌數據清洗
6.2.3 用戶識別和會話識別
6.2.4 訪問路徑填充
6.2.5 事務識別
6.3 序列模式挖掘
6.3.1 序列模式的定義
6.3.2 GSP算法
6.3.3 PrefixSpan算法
6.4 Web用戶行為模式挖掘
6.4.1 研究現狀
6.4.2 相關概念
6.4.3 用戶行為模式挖掘工作機理
6.5 Web用戶個性挖掘
6.5.1 個性挖掘的基本概念
6.5.2 個性屬性歸併
6.S.3用戶個性聚類
6.5.4 個性特徵與行為的關聯規則分析
6.5.5個性特徵的獲取
6.5.6 實例
6.6 Web用戶興趣感知
6.6.1 研究現狀
6.6.2 基於建構主義的學習興趣感知
6.6.3 用戶興趣模型的表示和更新
6.6.4 用戶興趣感知舉例
6.7 Web日誌挖掘的未來研究方向
6.8 小結
第7章 Web挖掘的套用實例
7.1 套用1:面向網路學習的學習者個性挖掘
7.1.1 學習者模型和數據收集
7.1.2 學習者個性挖掘機理
7.1.3 PELDIS工作流程
7.1.4 個性挖掘實例
7.2 套用2:海量Web資源中的知識處理與服務
7.2.1 體系結構與工作機理
7.2.2 基於主題圖的Web資源組織與管理
7.2.3 主題圖的自動生成
7.2.4 多維關聯索引構建與檢索結果的個性化排序
7.2.5 個性化資源推薦與導航
7.2.6 基於SOA的Yotta系統實現
7.3 小結
參考文獻

相關詞條

熱門詞條

聯絡我們