查詢重構

查詢重構

查詢重構指基於用戶原查詢詞,根據搜尋引擎查詢結果的反饋,用戶或者搜尋引擎自動更改或修正原查詢詞的行為。

基本介紹

  • 中文名:查詢重構
  • 外文名:query reconstruction
概念理解,發展,類型,模式研究,績效研究,影響因素,目前的研究與局限,

概念理解

查詢重構指基於用戶原查詢詞,根據搜尋引擎查詢結果的反饋,用戶或者搜尋引擎自動更改或修正原查詢詞的行為。從用戶角度來講,查詢重構是用戶根據檢索系統反饋的結果列表,不斷修正原查詢詞,以期得到所需求信息的過程。從檢索系統角度來講,查詢重構亦稱查詢式擴展,主要研究利用查詢擴展技術,如關聯規則挖掘、聚類算法偽相關反饋等對用戶輸入的檢索式進行擴展,使之更能代表用戶真正的查詢意圖。根據查詢重構的內涵,將查詢重構分為兩個階段:用戶構造初始查詢並點擊搜尋;用戶根據系統反饋的查詢結果列表重構初始查詢。

發展

對於大多數用戶而言,構造檢索詞是一個富有挑戰性的任務。搜尋引擎大都基於關鍵字進行檢索,用戶必須用幾個簡潔的關鍵字來表示欲搜尋信息,這就可能導致用戶不能很好地表達自己的查詢意圖。而用戶的互動行為,如網頁點擊、用戶反饋和查詢重構等均能表達用戶的查詢意圖。所以,通過分析用戶互動行為中的查詢重構行為,可使搜尋引擎支持多種查詢重構模式,並完善Web搜尋引擎的設計。A.Spink等設計了Excite日誌中用戶查詢重構的頻率,發現1997年和2001年分別有52%和45%的用戶重構原始查詢詞。
國外已有搜尋引擎實現了查詢重構功能,如AltaVista的Refine Your Search、Google的Did You Mean?、Exeite的ZOOM IN。但是2001年Exeite查詢重構工具ZOOM IN的評估機構發現:設計查詢重構工具列最應該考慮的不是接口的可用性和有效性,而是該工具推薦的查詢詞對用戶的實用性。目前支持查詢重構功能的檢索系統大都僅支持格式或拼寫錯誤的修正,不提供更多查詢重構的功能。因此,查詢重構內涵、作用機理的研究對完善搜尋引擎的設計顯得十分重要。

類型

查詢重構類型與模式分別指查詢重構策略的分類和一定時間或概念里,用戶查詢重構的序列。從用戶角度來講,查詢重構是用戶根據檢索系統反饋的結果列表,不斷修正原查詢詞,以期得到需求信息的過程。S.Y. Rieh和Xie Hong分析了Exeite搜尋引擎上的313個信息搜尋的查詢會話。他們定義了3 類查詢重構策略以及相關的查詢重構類型,如查詢語義的具體化、一般化、平行化、更改術語和更正錯誤。查詢語義的具體化指重構的查詢詞與原查詢詞相比概念更具體,如用戶通過增加單詞或替換成概念更具體的詞來提高檢索相關度,得到需求信息;查詢語義的平行化指當用戶修改原查詢詞時,從另外一個方面去構造該主題不同方面的查詢詞;查詢語義的一般化指當用戶沒有得到相關文檔時,通過刪減查詢詞或使用更一般性的詞來替代原查詢詞,從而使查詢結果相關。J. Teevan等基於雅虎的用戶搜尋日誌,探索用戶的重複檢索行為,並識別了查詢重構類型,如詞合併、刪除詞、抽取詞幹、多元化搜尋。B.J. Jansen 和 A.Spink 等對用戶查詢重構進行聚類得到以下幾種策略:查詢語義的具體化、一般化和更改內容。Guo Jiafeng 等在2008年將查詢重構的類型定義為拼寫錯誤、拆分詞、合併詞、切分短語等。2009 年,J. Huang 和 E. Efthimiadis探測到 13 種查詢重構類型,包括詞的重排序、增加空格和標點、刪除詞等。2011 年,B. Boldi 等開發了一種算法,自動追蹤查詢重構的類型。該算法觀察用戶在Web 搜尋引擎上的查詢重構行為,並自動劃分成不同類型,如查詢語義一般化、具體化和更改錯誤。

相關詞條

熱門詞條

聯絡我們