加權檢索

加權檢索是某些檢索系統中提供的一種定量檢索技術

基本介紹

  • 中文名:加權檢索
  • 用途:文獻檢索方式
1.加權檢索
加權檢索是某些檢索系統中提供的一種定量檢索技術。加權檢索同布爾檢索、截詞檢索等一樣,也是文獻檢索的一個基本檢索手段,但與它們不同的是,加權檢索的側重點不在於判定檢索詞或字元串是不是在資料庫中存在、與別的檢索詞或字元串是什麼關係,而是在於判定檢索詞或字元串在滿足檢索邏輯後對文獻命中與否的影響程度。運用加權檢索可以命中核心概念文獻,因此它是一種縮小檢索範圍提高檢準率的有效方法。
加權檢索的基本方法是:在每個檢索詞後面加寫一個數字,該數字表示檢索詞的“權”(Weight)值,表明該檢索詞的重要程度。在檢索過程中,一篇文獻是否被檢索中,不僅看該文獻是否與用戶提出的檢索詞相對應,而且要依據它所含檢索詞的“權”值之和來決定。如果一篇文獻所含檢索詞“權”值之和大於或者等於所指定的權值,該文獻命中,如果小於所指定的權值,則不命中。
例如,Rader(10),Laser(10),Communication(20),指定權值為30。
檢索的結果是只有包含上述三詞,或包括Rader及Communication,或包含Laser及Communication的文獻才會被命中。
在加權檢索中,計算機便檢索邊統計被檢文獻的權值之和,然後將文獻按權值的大小排列,凡在用戶指定的閾值之上者作為檢索命中的結果輸出。閾值可視命中文獻量的多寡靈活地進行調整。閾值越高,命中的文獻越少。在輸出的命中文獻中,由於按照權值從大到小排列。排列的次序反映了文獻切題程度的變化,有利於用戶區分閱讀次序。凡是布爾邏輯檢索能檢索到的文獻,加權檢索也能命中。採用加權檢索方法時,必須將計算“權”的函式作為子程式納入檢索系統中。
但並不是所有系統都能提供加權檢索這種檢索技術,而能提供加權檢索的系統,對權的定義、加權方式、權值計算和檢索結果的判定等方面,又有不同的技術規範。

相關詞條

熱門詞條

聯絡我們