機率檢索(probabilistic retrieval)是2019年公布的圖書館·情報與文獻學名詞。
基本介紹
- 中文名:機率檢索
- 外文名:probabilistic retrieval
- 所屬學科:圖書館·情報與文獻學
- 公布時間:2019年
機率檢索(probabilistic retrieval)是2019年公布的圖書館·情報與文獻學名詞。
機率檢索(probabilistic retrieval)是2019年公布的圖書館·情報與文獻學名詞。定義在機率模型的基礎上計算檢索詞和被檢索項相似度的一種檢索方法。出處《圖書館·情報與文獻學名詞》第一版。1...
其中,機率檢索模型是指根據機率論原理建立的各種檢索模型(函式式)的總稱,其核心是機率排序原理:為了對某一給定提問提供最優的檢索效果,系統應根據可獲得的信息將文獻按其與提問的相關機率來排序。模糊集合模型的基礎是模糊集合論,用...
《基於超幾何分布的無參機率信息檢索模型研究》是依託中國科學院大學,由何苯擔任項目負責人的青年科學基金項目。項目摘要 信息檢索模型是在大規模、跨域、多態的信息搜尋套用中的基礎核心技術。現有的信息檢索模型嚴重依賴於參數的調節,存在...
信息檢索的機率模型是信息檢索的經典模型,這種檢索模型是基於一個檔案與提問式的相關度是高於還是低於非相關度的機率來進行文檔檢索的檢索方法。特徵 文檔集合的所有辭彙是整個空間,每個文檔表示為該空間上的一個詞向量,每個詞對應一個...
《信息檢索:實現和評價搜尋引擎》從多個視角對信息檢索技術進行了深入講解,內容涵蓋了信息檢索系統的架構、基礎技術、詞條和詞項、靜態和動態倒排索引、查詢處理、索引壓縮技術、機率模型、語言模型、分類和過濾、融合和元學習、評價方法以及...
3.2 基於內容的文本檢索模型 3.2.1 檢索模型概述 3.2.2 布爾檢索模型 3.2.3 向量空間模型 3.2.4 機率檢索模型 3.2.5 結構化檢索模型 3.2.6 瀏覽檢索模型 3.3 基於內容的文本檢索系統 3.3.1 文本檢索系統概述 3.3....
潛在語義分析是一種對雙模型和同現數據進行分析的統計技術,它已經被套用於信患的檢索與過濾、自然語言處理、機器學習和一些相關的領域。標準的潛在語義分析主要是基於線性代數並且對同現表格進行奇異值分解。而機率潛在語義分析則是基於從...
2.2 機率檢索模型 2.3 語言模型 2.4 推理網路 2.5 擴展布爾檢索 2.6 LSI 2.7 神經網路 2.8 遺傳算法 2.9 模糊集檢索 2.10 本章小結 2.11 練習題 第3章 檢索實用策略 3.1 相關反饋 3.2 聚類 3.3 ...
最為常用的信息檢索模型有三種:向量空間模型 (Vector Space Model, VSM)機率模型 (Probabilistic Model)推理網路模型 (Inference Network Model)向量空間模型 向量空間模型最早由Gerard提出。在此模型中,一個文檔(Document)被描述成由一...
它直接影響檢索文檔的結構和檢索效率。傳統的檢索策略理論大都以二值相關性為基礎,這同實際的檢索過程有一定的差距,目前正大力發展以多值相關性為基礎的情報檢索理論體系,並研究各種情報檢索模型,如矢量空間檢索模型、機率檢索模型、模糊...
2.2網際網路信息檢索原理之一——信息組織 2.2.1文檔分析 2.2.2建立索引 2.2.3歸類和聚類 2.2.4元數據 2.3網際網路信息檢索原理之二——信息查詢 2.3.1布爾檢索模型 2.3.2擴展布爾模型 2.3.3向量空間模型 2.3.4機率檢索...
然而,現階段傳統檢索模型研究陷入瓶頸,表現為近若干年被提出的模型查準率提升幅度小,無法較好滿足用戶對於精準查詢的需求。本書通過引入數位訊號處理領域理論,提出了基於數字濾波的信息檢索模型構架DSPF,並通過與經典向量空間模型、機率模型...
3.6信息檢索評測 3.6.1TREC評測 3.6.2其他評測:NTCIR、CLEF、SEWM 3.7信息檢索模型與基本方法 3.7.1布爾檢索模型 3.7.2機率檢索模型 3.7.3向量空間模型 3.7.4模糊檢索模型 3.7.5邏輯檢索模型 3.7.6概念檢索 3.7.7...
6.4 機率檢索模型65 6.4.1 查詢似然檢索模型67 6.4.2 文檔語言模型的平滑69 6.4.3 具體的平滑方法72 書目說明和延伸閱讀76 練習76 第7章 反饋78 7.1 向量空間模型中的反饋79 7.2 語言模型中的反饋81 書目說明和延伸...
1.3.1信息檢索的發展歷史 1.3.2信息檢索的主要方法 1.3.3信息檢索的套用 1.3.4信息檢索的發展趨勢 習題 第2章信息檢索模型 2.1概述 2.2向量空間檢索模型 2.2.1內積 2.2.2相似度計算 2.3機率檢索模型 2.3...
中文文獻檢索技術出現在1974年,20世紀80年代得到了快速增長,90年代主要研究支持複合文檔的文檔管理系統。中文信息檢索在90年代之前都被稱為情報檢索,其主要研究內容有:包括布爾檢索模型、向量空間模型和機率檢索模型在內的信息檢索數學模型...
第2章 檢索模型與算法 7 2.1 向量空間模型 8 2.1.1 相似度計算舉例 11 2.1.2 相似度 13 2.2 機率檢索模型 14 2.2.1 簡單的詞項權重 15 2.2.2 非二值獨立模型 24 2.2.3 泊松模型 25 2.2.4 文檔片段 29 2.2...
2.2 集合論檢索模型 2.2.1 布爾檢索模型 2.2.2 模糊集合模型 2.2.3 擴展布爾模型 2.3 代數論檢索模型 2.3.1 向量空間模型 2.3.2 潛在語義索引模型 2.3.3 神經網路模型 2.4 機率論檢索模型 2.4.1 經典機率模型 2....
1.1.4信息檢索系統4 1.2分詞算法5 1.2.1分詞算法概述5 1.2.2詞典匹配分詞法6 1.2.3語義理解分詞法6 1.2.4詞頻統計分詞法7 1.3倒排索引7 1.4布爾檢索模型9 1.5tf-idf權重計算11 1.6向量空間模型13 1.7機率檢索模型...
然後除2取整而得到的。3.索引查詢 由於順序查找是按記錄的順序號從頭至尾地進行的,所以在“等機率”查找的情況下,查找一個記錄平均要比較N/2次(N為庫檔案記錄的總數),速度是比較慢的。索引查找可以有效地提高查找的速度。
該研究不需要聯合最佳化產生式模型和分類器,計算效率非常高,可套用於大規模數據檢索,有效提高檢索和識別的性能。(3)研究了機率相似度函式的判別式學習方法,在最佳化機率產生式模型的同時最佳化使用該相似度函式的目標任務性能,學習出的機率...
搜尋引擎可以幫助使用者在Internet上找到特定的信息,但它們同時也會返回大量無關的信息。如果您多使用一些下面介紹的技巧,將發現搜尋引擎會花盡可能少的時間找到您需要的確切信息。類別搜尋 許多搜尋引擎(如Yahoo!)都顯示類別,如計算機和...
信息檢索的機率視角 直觀上看,tf 描述的是文檔中詞出現的頻率;而 idf 是和詞出現文檔數相關的權重。我們比較容易定性地理解 tf-idf 的基本思想,但具體到 tf-idf 的一些細節卻並不是那么容易說清楚為什麼。總結 TF-IDF 模型是搜尋...
貝葉斯網路(Bayesian network),又稱信念網路(belief network)或是有向無環圖模型(directed acyclic graphical model),是一種機率圖型模型。簡介 貝葉斯網路又稱信度網路,是Bayes方法的擴展,是目前不確定知識表達和推理領域最有效的...
樸素貝葉斯分類器是一系列以假設特徵之間強(樸素)獨立下運用貝葉斯定理為基礎的簡單機率分類器。該分類器模型會給問題實例分配用特徵值表示的類標籤,類標籤取自有限集合。它不是訓練這種分類器的單一算法,而是一系列基於相同原理的算法:...