Web數據挖掘(人民郵電出版社書籍)

編輯推薦

本書是Web挖掘與搜尋引擎領域的經典著作，自出版以來深受好評，已經被斯坦福、普林斯頓、卡內基梅隆等世界名校採用為教材。書中首先介紹了Web爬行和搜尋等許多基礎性的問題，並以此為基礎，深入闡述了解決Web挖掘各種難題所涉及的機器學習技術，提出了機器學習在系統獲取、存儲和分析數據中的許多套用，並探討了這些套用的優劣和發展前景。全書分析透徹，富於前瞻性，為構建Web挖掘創新性套用奠定了理論和實踐基礎，既適用於信息檢索和機器學習領域的研究人員和高校師生，也是廣大Web開發人員的優秀參考書。

“本書深入揭示了搜尋引擎的技術內幕！有了它，你甚至能夠自己開發一個搜尋引擎。”

——searchenginewatch網站

“本書系統、全面而且深入，廣大Web技術開發人員都能很好地理解和掌握其中內容。作者是該研究領域的領軍人物之一，在超文本信息挖掘和檢索方面有著淵博的知識和獨到的見解。”

——Joydeep Ghosh，德克薩斯大學奧斯汀分校教授，IEEE會士

“作者將該領域的所有重要工作融合到這部傑作中，並以一種通俗易懂的方式介紹了原本非常

深奧的內容。有了這本書，Web挖掘終於有可能成為大學的一門課程了。”

——Jaideep Srivastava，明尼蘇達大學教授，IEEE會士

內容簡介

《Web數據挖掘》是適用於數據挖掘學術研究和開發的專業人員的參考書，同時也適合作為高等院校計算機及相關專業研究生的教材。書中首先論述了Web的基礎（包括Web信息採集機制、Web標引機制以及基於關鍵字或基於相似性搜尋機制），然後系統地描述了Web挖掘的基礎知識，著重介紹基於超文本的機器學習和數據挖掘方法，如聚類、協同過濾、監督學習、半監督學習，最後講述了這些基本原理在Web挖掘中的套用。《Web數據挖掘》為讀者提供了堅實的技術背景和最新的知識。

作品目錄

INTRODUCTION

1.1 Crawling and Indexing

1.2 Topic Directories

1.3 Clustering and Classification

1.4 Hyperlink Analysis

1.5 Resource Discovery and Vertical Portals

1.6 Structured vs. Unstructured Data Mining

1.7 Bibliographic Notes

PART Ⅰ INFRASTRUCTURE

2 CRAWLING THE WEB

2.1 HTML and HTTP Basics

2.2 Crawling Basics

2.3 Engineering Large-Scale Crawlers

2.3.1 DNS Caching, Prefetching, and Resolution

Web數據挖掘(人民郵電出版社書籍)

基本介紹

編輯推薦

內容簡介

作品目錄

作者簡介

相關詞條

熱門詞條