世界著名計算機教材精選:Web數據挖掘

世界著名計算機教材精選:Web數據挖掘

《世界著名計算機教材精選:Web數據挖掘(第2版)》旨在闡述Web數據挖掘的概念及其核心算法,使讀者獲得相對完整的關於Web數據挖掘的算法和技術知識,《世界著名計算機教材精選:Web數據挖掘(第2版)》不僅介紹了搜尋、頁面爬取和資源探索以及連結分析等傳統的Web挖掘主題,而且還介紹了結構化數據的抽取、信息整合、觀點挖掘和Web使用挖掘等內容,這些內容在已有書籍中沒有提及過,但它們在Web數據挖掘中卻占有非常重要的地位,全書分為兩大部分;第一部分包括第2章到第5章,介紹數據挖掘的基礎,第二部分包括第6章到第12章,介紹Web相關的挖掘任務。從《世界著名計算機教材精選:Web數據挖掘(第2版)》自第1版出版之後,很多領域已經有了重大的進展,新版大部分的章節都已經添加了新的材料來反應這些進展,主要的改動在第11章和第12章中,這兩章已經被重新撰寫並做了重要的擴展。

基本介紹

  • 書名:世界著名計算機教材精選:Web數據挖掘
  • 作者:劉兵
  • 類型:計算機與網際網路
  • 出版日期:2013年1月1日
  • 語種:簡體中文
  • ISBN:9787302298700
  • 外文名:Web Data Mining,Second Edition
  • 譯者:俞勇
  • 出版社:清華大學出版社
  • 頁數:434頁
  • 開本:16
  • 品牌:清華大學出版社
基本介紹,內容簡介,作者簡介,圖書目錄,

基本介紹

內容簡介

《世界著名計算機教材精選:Web數據挖掘(第2版)》不僅可作為本科生的教科書,也是在Web數據挖掘和相關領域研讀博士學位的研究生的重要參考用書,同時對Web挖掘研究人員和實踐人員獲取知識、信息、甚至是創新想法也很有幫助。

作者簡介

作者:(美國)劉兵 譯者:俞勇

圖書目錄

第1章 概述
1.1 什麼是全球資訊網
1.2 全球資訊網和網際網路的歷史簡述
1.3 Web數據挖掘
1.3.1 什麼是數據挖掘
1.3.2 什麼是Web數據挖掘
1.4 各章概要
1.5 如何閱讀本書
文獻評註
參考文獻
第1部分 數據挖掘基礎
第2章 關聯規則和序列模式
2.1 關聯規則的基本概念
2.2 Apriori算法
2.2.1 頻繁項目集生成
2.2.2 關聯規則生成
2.3 關聯規則挖掘的數據格式
2.4 多最小支持度的關聯規則挖掘
2.4.1 擴展模型
2.4.2挖掘算法
2.4.3 規則生成
2.5 分類關聯規則挖掘
2.5.1 問題描述
2.5.2 挖掘算法
2.5.3 多最小支持度分類關聯規則挖掘
2.6 序列模式的基本概念
2.7 基於GSP挖掘序列模式
2.7.1 GSP算法
2.7.2 多最小支持度挖掘
2.8基於PrefixSpan算法的序列模式挖掘
2.8.1 PrefixSpan算法
2.8.2 多最小支持度挖掘
2.9 從序列模式中產生規則
2.9.1 序列規則
2.9.2 標籤序列規則
2.9.3 分類序列規則
文獻評註
參考文獻
第3章 監督學習
3.1 基本概念
3.2 決策樹歸納
3.2.1 學習算法
3.2.2 混雜度函式
3.2.3 處理連續屬性
3.2.4其他一些問題
3.3評估分類器
3.3.1 評估方法
3.3.2 查準率、查全率、F—score和平衡點(Breakeven Point)
3.3.3 受試者工作特徵曲線
3.3.4 提升曲線
3.4 規則歸納
3.4.1 順序化覆蓋
3.4.2 規則學習:Learn—One—Rule函式
3.4.3 討論
3.5 基於關聯規則的分類
3.5.1 使用類關聯規則進行分類
3.5.2 使用類關聯規則作為分類屬性
3.5.3 使用古典的關聯規則分類
3.6 樸素貝葉斯分類
3.7 樸素貝葉斯文本分類
3.7.1 機率框架
3.7.2 樸素貝葉斯模型
3.7.3 討論
3.8 支持向量機
3.8.1 線性支持向量機:可分的情況
3.8.2 線性支持向量機:數據不可分的情況
3.8.3 非線性支持向量機:核方法
總結
3.9 k—近鄰學習
3.10分類器的集成
3.10.1 Bagging
3.10.2 Boosting
文獻評註
參考文獻
第4章 無監督學習
4.1 基本概念
4.2 k—均值聚類
4.2.1 k—均值算法
4.2.2 k—均值算法的硬碟版本
4.2.3 優勢和劣勢
4.3 聚類的表示
4.3.1 聚類的一般表示方法
4.3.2 任意形狀的聚類
4.4 層次聚類
4.4.1 單連結方法
4.4.2全連結方法
4.4.3 平均連結方法
4.4.4優勢和劣勢
4.5 距離函式
4.5.1 數字屬性
4.5.2 布爾屬性和名詞性屬性
4.5.3 文本文檔
4.6數據標準化
4.7 混合屬性的處理
4.8 採用哪種聚類算法
4.9聚類的評估
4.10 發現數據區域和數據空洞
文獻評註
參考文獻
第5章 部分監督學習
5.1 從已標註數據和無標註數據中學習
5.1.1 使用樸素貝葉斯分類器的EM算法
5.1.2 Co—Training
5.1.3 自學習
5.1.4 直推式支持向量機
5.1.5 基於圖的方法
5.1.6 討論
5.2 從正例和無標註數據中學習
5.2.1 PU學習的套用
5.2.2 理論基礎
5.2.3 建立分類器:兩步方法
5.2.4建立分類器:偏置SVM
5.2.5建立分類器:機率估計
5.2.6 討論
……
第2部分 Web挖掘
  

相關詞條

熱門詞條

聯絡我們