向量檢索

向量檢索,計算機情報檢索的一種重要方式。

基本介紹

  • 中文名:向量檢索
  • 釋義:計算機情報檢索的一種重要方式
解釋
檢索系統中的每一個記錄(文獻表示或數據條目)用一個由若干標引詞的權值構成的向量來表示,稱為文獻向量。通過計算文獻向量之間的相似度生成聚類文檔,作為檢索的基礎。
用戶的問題(信息需求)也用同樣的方法表示,稱為提問向量。檢索作業(即提問向量與文獻向量的匹配操作)在系統的聚類文檔中進行。先計算給定提問向量與文獻(類)向量之間的相似度,然後使相似度超過某一閾值(或者根據預定要檢出的文獻數量)的文獻按相似度大小降序排列輸出。
採用此方式的檢索系統實現了局部匹配策略和排序輸出技術,提高了檢索的靈活性和效率。它還可以採用相關反饋技術來自動最佳化提問向量,或者採用動態文獻向量調整技術來最佳化聚類文檔的結構,進一步改善檢索效果。基於上述原理建立的系統模型稱為向量空間模型。此模型以假定標引詞之間相互獨立(即具有正交性)為前提,故存在一定的理論缺陷。

相關詞條

熱門詞條

聯絡我們