面向搜尋引擎的用戶個性化查詢意圖分析

《面向搜尋引擎的用戶個性化查詢意圖分析》是依託哈爾濱工業大學,由陳毅恆擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:面向搜尋引擎的用戶個性化查詢意圖分析
  • 依託單位:哈爾濱工業大學
  • 項目類別:青年科學基金項目
  • 項目負責人:陳毅恆
項目摘要,結題摘要,

項目摘要

查詢意圖分析是信息檢索研究中一個非常重要的課題,對於改善搜尋引擎性能以及用戶搜尋體驗有著十分重要的作用。然而在當前的查詢意圖分析研究中,用戶個性化信息並沒有得到充分利用。為此本項目提出了一種融合用戶個性化信息的查詢意圖分析方法。具體地,本方法包含以下幾個主要方面:(1)提出了在查詢意圖分析模型中使用用戶個性化信息作為特徵,旨在使查詢意圖分析的結果體現出不同用戶的差異性;(2) 提出了基於用戶自然標註資源的共性查詢意圖識別與挖掘方法,即能識別巨觀的用戶查詢意圖,又可自動挖掘細粒度的查詢意圖;(3)提出了基於話題模型的個性化用戶檢索興趣建模方法,可以更好的學習用戶模型,改善查詢意圖分析的效果;(4)將查詢類別信息作為查詢意圖識別的重要特徵加以利用,並提出了基於URL的查詢分類算法,可以極大提高查詢分類的效率;(5)將本項目提出的查詢意圖分析方法套用於檢索結果聚類,即圍繞多種不同的查詢意圖對搜尋

結題摘要

搜尋引擎成為人們從網際網路上快速獲取信息的最主要途徑之一。當前的搜尋引擎主要基於關鍵字匹配的搜尋模式。然而用戶輸入的查詢往往較短,導致查詢具有多種語義或包含有多個子主題。本課題專注於信息類查詢的意圖表示、識別與套用。特別地,從查詢表層字元信息上升到主題層面,採取不同的主題形式來形式化地表示查詢背後的搜尋意圖,從多個角度理解查詢意圖,並基於查詢意圖提供新穎的搜尋服務與搜尋模式。 本課題的主要貢獻可概括如下: (1)針對查詢歧義問題,以主題類別表示查詢意圖,將查詢映射到給定的主題類別體系中,即將查詢意圖識別歸結為查詢主題分類問題。本課題提出一種基於用戶自動標註資源的查詢主題分類方法。僅需要很少的人工參與,卻可以獲得海量的有主題標註的查詢,基於有標註的查詢得以訓練基於統計的查詢分類器。方法改善了查詢分類缺少標註查詢的數據稀疏問題,不僅分類準確率高而且具有較高線上處理效率,可以套用於多種查詢意圖識別相關的套用場景。 (2)針對查詢寬泛問題,以一組查詢子主題表示查詢意圖。查詢子主題不依賴於預先指定的類別體系,能夠在更細緻的層面對查詢意圖進行刻劃,是對查詢主題分類的補充。本課題分析了從各個信息源中抽取的查詢子主題候選的特點,並套用適於任務需要的聚類算法。實驗表明,提出的方法獲得了比商業搜尋引擎相關搜尋更好的性能。 (3)針對查詢意圖與用戶相關的問題,以用戶主題興趣表示查詢意圖,從用戶個人興趣的角度個性化地表示查詢意圖。為了更準確地判斷每一位用戶具體的查詢意圖需要考察用戶背景與興趣等個人信息。本課題基於機率主題模型對用戶搜尋歷史進行建模,建立用戶的主題興趣模型,將用戶查詢依據其與用戶歷史興趣的相關性映射到用戶主題興趣模型之中,實現個性化的查詢意圖識別。據我們所知,這是首次將基於主題模型的用戶建模與個性化搜尋相結合的工作。 因此,基於主題的查詢意圖識別研究對搜尋引擎具有以下的促進作用:(1)構建用戶的信息需求結構空間,結構化地組織信息,有效地幫助用戶清晰地了解相關信息結構,明確自身搜尋目的;(2)豐富搜尋引擎的搜尋模式,提高搜尋質量,準確且迅速地滿足用戶的信息需求。

相關詞條

熱門詞條

聯絡我們