本書通過對基於個性化信息推薦技術的搜尋引擎伺服器日誌中所具有關鍵字序列得到用戶模式,並按照事務模式聚類的方法實現用戶個性化特徵的表達,最後在搜尋引擎的網頁索引中,利用得到的用戶個性化特徵改進傳統的PegeRank算法。通過上述工作,本書構建了一個完整的基於Web個性化信秘推薦技術的搜尋引擎框架結構。
基本介紹
內容簡介,目錄,
內容簡介
本書可作為計算機專業的本科生和研究生的參考用書,也可供有關技術人員參考。
目錄
前言
第1章 緒論
1.1 Web信息檢索
1.1.1 Web信息檢索模型
1.1.2 向量空間模型
1.1.3 搜尋引擎
1.1.4 搜尋引擎工作原理
1.1.5 相關度排序技術
1.2 Web挖掘
1.2.1 Web挖掘的概念
1.2.2 Web挖掘的類型
1.2.3 Web挖掘的研究進展
1.3 web個性化信息推薦服務
1.3.1 概念
1.3.2 Web個性化信息推薦服務的種類劃分
1.3.3 Web個性化信息推薦服務的發展
第2章 網頁權重分析技術
2.1 網頁質量分析技術
2.1.1 結合網頁質量分析的Web信息檢索模式
2.1.2 網頁質量測度方法
2.2 網頁相關度分析技術
2.2.1 標準PageRank算法
2.2.2 PageRank的最佳化計算
第3章 個性化搜尋引擎
3.1 概念與特點
3.1.1 現代搜尋引擎系統存在的問題
3.1.2 個性化搜尋引擎的含義
3.1.3 現階段個性化搜尋引擎的不足
3.2 基本類型
3.2.1 基於個性化信息採集的個性化搜尋引擎
3.2.2 基於查詢改進的個性化搜尋引擎
3.2.3 基於個性化網頁權重的個性化搜尋引擎
第4章 用戶個性化模式的獲取和表達
4.1 基於關鍵字序列的用戶模式識別
4.1.1 概述
4.1.2 數據準備
4.1.3 用戶識別
4.1.4 事務模式識別
4.2 基於用戶事務模式聚類的Web信息個性化表達
4.2.1 用戶事務模式的類別構造
4.2.2 基於頻繁路徑的用戶事務模式類別構造
4.2.3 降維處理問題
第5章 基於關鍵字序列的個性化網頁權重方法
5.1 方法概述
5.2 基於修改網頁權重值的個性化PageRank
5.3 基於添加修正參數的個性化PageRank
5.3.1 使用事務聚類模式的個性化PageRank方法
5.3.2 使用主題化事務聚類模式的個性化PageRank方法
第6章 系統原型的實現
6.1 系統的開發方式
6.2 數據結構
6.3 存儲過程
6.4 系統的功能模組
6.4.1 爬蟲模組
6.4.2 Web網頁分析模組
6.4.3 日誌分析模組
6.4.4 用戶接口模組
6.5 結果分析
6.5.1 關鍵字訪問序列的獲取情況
6.5.2 用戶事務模式的獲取情況
6.5.3 用戶事務模式的聚類情況
6.5.4 個性化PageRank值的計算情況
6.6 系統框架評價
參考文獻