《基於潛在語義的個性化搜尋關鍵技術研究》編著者陳冬玲。隨著網路技術的飛速發展,信息爆炸所產生的個人信息疲勞和信息壓力使搜尋引擎變得越來越重要,搜尋引擎已經成為名副其實的信息樞紐和信息門戶,是用戶獲取網路信息的首選工具。本文從用戶潛在語義動機的理解出發,針對個性化搜尋各個環節中的關鍵技術展開研究,如用戶建模技術、查詢擴展技術、網頁局部最佳化排序技術、聚類技術等,力求達到用戶查詢與搜尋引擎返回結果的高效匹配。
基本介紹
- 書名:基於潛在語義的個性化搜尋關鍵技術研究
- 出版社:中國水利水電出版社
- 頁數:141頁
- 開本:16
- 作者:陳冬玲
- 出版日期:2013年8月1日
- 語種:簡體中文
- ISBN:751701031X
內容簡介,圖書目錄,
內容簡介
《基於潛在語義的個性化搜尋關鍵技術研究》從用戶潛在語義動機的理解出發,針對個性化搜尋各個環節中的關鍵技術展開研究,如用戶建模技術、查詢擴展技術、網頁局部最佳化排序技術、聚類技術等,力求達到用戶查詢與搜尋引擎返回結果的高效匹配。
圖書目錄
前言
第1章緒論
1.1搜尋引擎體系結構及功能
1.1.1信息的收集
1.1.2信息預處理
1.1.3查詢服務
1.2個性化搜尋引擎
1.2.1個性化搜尋引擎的體系結構
1.2.2個性化搜尋關鍵技術
1.2.3個性化搜尋研究現狀
1.2.4個性化搜尋面臨的問題與挑戰
1.3本文研究的主要內容
1.4本文的組織結構
第2章基於機率潛在語義的用戶模型構造
2.1問題提出
2.2用戶模型研究綜述
2.2.1用戶模型的創建技術研究
2.2.2用戶模型的學習與更新技術研究
2.2.3用戶模型套用技術的研究
2.3用戶搜尋行為的理論分析
2.3.1從認知角度分析用戶的搜尋行為
2.3.2用戶搜尋行為的不確定性
2.3.3用戶搜尋行為分析的邏輯框架
2.4用戶動機分析的兩類不確定問題
2.5基於PLSA的潛在概念獲取與用戶模型構建
2.5.1機率潛在語義分析
2.5.2潛在語義空間的Zipf分布
2.5.3基於PLSA的用戶動機建模
2.5.4用戶模型的學習與更新
2.6實驗及評價
2.6.1數據集
2.6.2評價標準
2.6.3實驗結果及分析
2.7本章小結
第3章基於有限混合模型的文本聚類
3.1問題提出
3.2傳統聚類算法的概述
3.2.1基於相似性的聚類方法
3.2.2基於模型的聚類
3.2.3各類算法的對比分析
3.3傳統聚類方式在個性化搜尋中存在的問題
3.4基於有限混合主題模型的文檔聚類分析
3.4.1有限混合模型
3.4.2EM算法
3.4.3基於有限混合模型的文檔聚類
3.5實驗及評價
3.5.1實驗數據集
3.5.2評價標準
3.5.3實驗結果及分析
3.6本章小結
第4章基於用戶潛在語義動機的查詢擴展
4.1問題提出
4.2現有的查詢擴展方法概述
4.2.1基於大規模語料庫的查詢擴展方法
4.2.2基於語義關係/語義結構的查詢擴展方法
4.3目前查詢擴展方法的不足
4.4基於潛在語義動機的查詢擴展
4.4.1ULSM—QE的框架
4.4.2查詢詞處理
4.4.3查詢語義動機分析
4.4.4相關度計算
4.4.5查詢詞的語義消歧
4.4.6生成新查詢
4.5實驗及評價
4.5.1數據集
4.5.2評價標準
4.5.3實驗結果及分析
4.6本章小結
第5章基於用戶偏好的網頁排序局部最佳化策略
5.1問題提出
5.2傳統網頁排序算法介紹
5.2.1PageRank算法及其衍生算法
5.2.2HITS算法
5.3傳統排序算法存在的問題
5.4基於用戶偏好的網頁排序
5.4.1UP—PR.框架
5.4.2查詢詞的主題分類
5.4.3網頁的主題分類
5.4.4參數的選擇
5.5實驗及評價
5.5.1數據集
5.5.2評價標準
5.5.3實驗結果及分析
5.6本章小結
第6章結論
6.1本文的主要貢獻與結論
6.2進一步的工作
參考文獻
作者簡介
第1章緒論
1.1搜尋引擎體系結構及功能
1.1.1信息的收集
1.1.2信息預處理
1.1.3查詢服務
1.2個性化搜尋引擎
1.2.1個性化搜尋引擎的體系結構
1.2.2個性化搜尋關鍵技術
1.2.3個性化搜尋研究現狀
1.2.4個性化搜尋面臨的問題與挑戰
1.3本文研究的主要內容
1.4本文的組織結構
第2章基於機率潛在語義的用戶模型構造
2.1問題提出
2.2用戶模型研究綜述
2.2.1用戶模型的創建技術研究
2.2.2用戶模型的學習與更新技術研究
2.2.3用戶模型套用技術的研究
2.3用戶搜尋行為的理論分析
2.3.1從認知角度分析用戶的搜尋行為
2.3.2用戶搜尋行為的不確定性
2.3.3用戶搜尋行為分析的邏輯框架
2.4用戶動機分析的兩類不確定問題
2.5基於PLSA的潛在概念獲取與用戶模型構建
2.5.1機率潛在語義分析
2.5.2潛在語義空間的Zipf分布
2.5.3基於PLSA的用戶動機建模
2.5.4用戶模型的學習與更新
2.6實驗及評價
2.6.1數據集
2.6.2評價標準
2.6.3實驗結果及分析
2.7本章小結
第3章基於有限混合模型的文本聚類
3.1問題提出
3.2傳統聚類算法的概述
3.2.1基於相似性的聚類方法
3.2.2基於模型的聚類
3.2.3各類算法的對比分析
3.3傳統聚類方式在個性化搜尋中存在的問題
3.4基於有限混合主題模型的文檔聚類分析
3.4.1有限混合模型
3.4.2EM算法
3.4.3基於有限混合模型的文檔聚類
3.5實驗及評價
3.5.1實驗數據集
3.5.2評價標準
3.5.3實驗結果及分析
3.6本章小結
第4章基於用戶潛在語義動機的查詢擴展
4.1問題提出
4.2現有的查詢擴展方法概述
4.2.1基於大規模語料庫的查詢擴展方法
4.2.2基於語義關係/語義結構的查詢擴展方法
4.3目前查詢擴展方法的不足
4.4基於潛在語義動機的查詢擴展
4.4.1ULSM—QE的框架
4.4.2查詢詞處理
4.4.3查詢語義動機分析
4.4.4相關度計算
4.4.5查詢詞的語義消歧
4.4.6生成新查詢
4.5實驗及評價
4.5.1數據集
4.5.2評價標準
4.5.3實驗結果及分析
4.6本章小結
第5章基於用戶偏好的網頁排序局部最佳化策略
5.1問題提出
5.2傳統網頁排序算法介紹
5.2.1PageRank算法及其衍生算法
5.2.2HITS算法
5.3傳統排序算法存在的問題
5.4基於用戶偏好的網頁排序
5.4.1UP—PR.框架
5.4.2查詢詞的主題分類
5.4.3網頁的主題分類
5.4.4參數的選擇
5.5實驗及評價
5.5.1數據集
5.5.2評價標準
5.5.3實驗結果及分析
5.6本章小結
第6章結論
6.1本文的主要貢獻與結論
6.2進一步的工作
參考文獻
作者簡介