文檔信息檢索(document retrieval; document information retrieval )是2016年公布的管理科學技術名詞。
基本介紹
- 中文名:文檔信息檢索
- 外文名:document retrieval; document information retrieval
- 所屬學科:管理科學技術
- 公布時間:2016年
文檔信息檢索(document retrieval; document information retrieval )是2016年公布的管理科學技術名詞。
文檔信息檢索(document retrieval; document information retrieval )是2016年公布的管理科學技術名詞。定義將文檔集按一定的方式組織和存儲起來,並根據信息用戶的需求查找有...
其中最有代表性的是Luhn在IBM公司的工作,他提出了利用詞對文檔構建索引並利用檢索與文檔中詞的匹配程度進行檢索 的方法,這種方法就是常用的倒排文檔技術的雛形。在60年代,信息檢索技術的一些關鍵技術獲取了突破。其間出現了一些優秀的...
文本檢索(Text Retrieval)與圖象檢索、聲音檢索、圖片檢索等都是信息檢索的一部分,是指根據文本內容,如關鍵字、語意等對文本集合進行檢索、分類、過濾等。技術介紹 文本檢索,亦稱為自然語言檢索,指不對文獻進行任何標引,直接通過...
由信息檢索原理可知,信息的存儲是實現信息檢索的基礎。這裡要存儲的信息不僅包括原始文檔數據,還包括圖片、視頻和音頻等,首先要將這些原始信息進行計算機語言的轉換,並將其存儲在資料庫中,否則無法進行機器識別。待用戶根據意圖輸入查詢...
Goonie全文檢索系統以先進的信息整合處理技術為核心,為政府及企業建設高性能信息檢索平台,能夠將分散的多種信息集中檢索,讓用戶在一個檢索界面即可獲取到所需的各種相關信息,不論是區域網路的網頁、辦公的文檔、行業的資料庫,對於Goonie都能...
這是信息檢索評測技術產生的原因,也是其主要發展方向。技術簡介 1. 數據預處理 目前檢索系統的主要數據來源是Web,格式包括網頁、WORD 文檔、PDF 文檔等,這些格式的數據除了正文內容之外,還有大量的標記信息,因此從多種格式的數據中提取...
經過網頁預處理後,可以建立索引資料庫。對於數目龐大的文檔資料庫使用簡單匹配方法是不可行的,需要對文檔的表示建立索引。為了提高檢索效率,應該按照一定的規則建立索引。索引檔案一般是按照倒排檔案的格式存放的,通用的信息索引的建立包括...
信息資源檢索由信息組織和信息檢索兩大部分組成。信息組織是按照信息檢索的需要,對數據及其特性進行描述和組織;信息檢索是從大量的文檔集中獲取用戶需要的相關信息。信息資源檢索按檢索對象分為文獻專題檢索、全文檢索和多媒體檢索;按設備分...
計算機檢索包括光碟資料庫、網路資料庫檢索和網際網路信息檢索。發展歷史 計算機文獻檢索的發展歷程大致可以概括為批量處理、在線上檢索與網路系統三個階段。批量處理 1954年,美國海軍武器實驗站圖書館在一台電子管計算機上建立了世界上第一個...
在深入分析文檔的描述方法、用戶的信息需求、檢索方法和用戶任務的基礎上,總結了XML語言在文檔描述、信息檢索等方面的優勢,研究了XML文檔的索引實現方法,並以檢索實驗系統Okapi為例,探討了如何在傳統信息檢索系統上實現XML文檔的索引以...
向量空間模型(Vector Space Model,VSM)是由美國康奈爾大學的Salton教授領導的研究小組在20世紀60年代末到70年代初提出並發展起來的一種信息檢索模型。在該模型中,查詢和文檔都被看成是由若干特徵詞組成的向量,所有的文檔集構成了一個...
信息檢索是從大規模非結構化數據(通常是文本)的集合(通常保存在計算機上)中找出滿足用戶信息需求的資料(通常是文檔)的過程。進而我們定義:短文本檢索是從海量、無結構、不規範以及相關的短文本數據集合中找出滿足用戶信息需求的過程。
它的主要功能是理解搜尋器所採集的網頁信息,並從中抽取索引項。3、檢索器。其功能是快速查找文檔,進行文檔與查詢的相關度評價,對要輸出的結果進行排序。4、用戶接口。它為用戶提供可視化的查詢輸入和結果輸出的界面。功能模組 搜尋引擎...
它根據用戶給出的檢索詞進行檢索,可檢索檔案名稱、目錄名、文檔及其他信息資源。3.基於關鍵字的檢索工具 WAIS(wide area information serve)信息服務軟體是基於關鍵字的檢索工具。使用WAIS用戶不必操心檢索信息在網路中的哪台計算機上,也不...
檢索測試查詢即根據文檔集中文檔內容的分布情況,將文檔集劃分成多個類別,在每個類別中根據文檔的具體內容來創建查詢主題,然後篩選查詢主題,避免出現敘述不清或相似性較高的查詢主題。檢索測試集 文檔集是整個測試集的基礎。由於信息檢索的...
《文本挖掘與信息檢索概論》是清華大學出版社於2022年出版的書籍,作者是蔡曉妍、楊黎斌、程塨、姚西文、姚超、韓軍偉 內容簡介 文本挖掘與信息檢索是近年來人工智慧領域的熱點研究方向。本書共8章,包括信息檢索概述、信息檢索模型、信息...
《文獻信息檢索理論、方法和案例分析》是2014年9月機械工業出版社出版的圖書,作者是何曉萍。內容簡介 本書從理論上系統闡述了數字信息資源檢索原理、信息檢索方法和信息檢索技術;根據信息資源有效使用的時效性,敘述了常用資源平台檢索工具的...
上下文檢索(context search)是2019年全國科學技術名詞審定委員會公布的圖書館·情報與文獻學名詞。定義 一種嵌入上下文環境中的智慧型信息檢索方法。允許用戶通過提問擴展法不斷選擇和修正與提問有關的上下文屬性值,而系統通過來自文檔和用戶...
文獻信息檢索與利用課程是成都航空職業技術學院於2018年04月02日首次在中國大學MOOC開設的慕課課程、國家精品線上開放課程(高職)。該課程授課教師是陳萍秀、蒲攀、於蓓莉、屈仁春。據2021年3月中國大學MOOC官網顯示,該課程已開課8次。文...
檢索是指從文獻資料、網路信息等信息集合中查找到自己需要的信息或資料的過程。相關檢索是指使用關鍵字檢索時,除得到相應的檢索結果之外,還會得到一些檢索詞有關的關鍵字,一般具有較高的檢索效率相關檢索技術是網路信息檢索系統所特有的...
《文本數據管理與分析:信息檢索與文本挖掘的實用導論》是2019年機械工業出版社出版的圖書,作者是翟成祥、肖恩·馬森 。內容簡介 本書從實際角度涵蓋了信息檢索和文本數據挖掘領域的主要概念、技術和方法,並包括許多專門設計並輔以配套...
1.1什麼是信息檢索 1.1.1web搜尋 1.1.2其他搜尋套用 1.1.3其他信息檢索套用 1.2信息檢索系統 1.2.1信息檢索系統基礎架構 1.2.2文檔及其更新 1.2.3性能評價 1.3使用電子文本 1.3.1文本格式 1.3.2英文文本中的分詞 ....
(4)用戶對檢索的查全與查準要求 為滿足查全要求,就要普查多種資料庫,為快速滿足查準要求,應選擇主題範圍最專指的資料庫。策略設計 網路信息檢索策略設計應遵循快、準、全及低成本的原則,以實現檢索策略最最佳化。所謂快、準、全...
3.1.4 國內外計算機信息檢索的發展概況 (43)3.2 計算機信息檢索的原理和技術 (45)3.2.1 計算機信息檢索原理 (45)3.2.2 計算機信息檢索技術 (46)3.3 文本信息檢索 (54)3.3.1 順排文檔與倒排文檔檢索 (54)3.3...
檢索設計 精確匹配模型 在“布爾模型”、“向量空間模型”和“機率模型”基礎之上,下面是一種信息檢索精確匹配模型。採用國標漢字字元集GBK/2:GB2312中包含的6763個漢字作為文檔特徵項。①文檔特徵項可以表示為向量形式: ,其中n=6763...
從上述過程可以看出,信息檢索中要先對處理對象(文檔、查詢)進行表示,然後計算對象表示之間的相關度。對檢索對象進行表示並計算他們之間的相關度屬於信息檢索模型的範疇。目前主要有向量空間模型、機率模型和統計建模語言模型三種經典信息檢索...
信息檢索概述 信息檢索是當前套用十分廣泛的一種技術,論文檢索、搜尋引擎都屬於信息檢索的範疇。通常,人們把信息檢索問題抽象為:在文檔集合D上,對於由關鍵字w[1] … w[k]組成的查詢串q,返回一個按查詢q和文檔d匹配度 relevance (...