信息檢索系統

信息檢索系統

信息檢索系統(Information Retrieval System)是指根據特定的信息需求而建立起來的一種有關信息蒐集、加工、存儲和檢索的程式化系統.其主要目的是為人們提供信息服務。所以可以說任何具有信息存儲信息檢索功能的系統都可以稱為信息檢索系統.信息檢索系統可以理解為一種可以向用戶提供信息檢索服務的系統。

基本介紹

  • 中文名:信息檢索系統
  • 外文名:Information Retrieval System
  • 要素:人、檢索工具和信息資料
發展,目標,職能,分類,結構,

發展

信息檢索工具的發展從無到有,經歷了手工、自動化、計算機檢索、計算機網路檢索這4個主要階段。
1.手工階段
所謂手工檢索工具,信息載體基本上是以紙質為主,其工具本身是某類形式的印刷出版物,以手工進行查閱,從而得到所需的文獻。這種方式經歷了相當長的歷史時期,大約有2 000多年的時間,雖然後期出現了縮微(膠片)型的檢索工具,但基本上還是通過手工來完成檢索任務手工檢索工具種類繁多,功能也比較齊全,各種文摘、題錄、書目、索引等都屬於手工檢索工具。到今天為止,手工檢索工具還在發揮著很重要的作用。
2.自動化階段
隨著科學技術的發展,文獻量隨之增長,特別是到了20世紀三四十年代,自然科學的發展進入了一個前所未有的歷史時期,老的學科得到了迅速發展,同時湧現出了很多新的學科,出版的刊物也隨之大量增加,文獻量急劇增長,依靠原有的手工檢索方法往往要花去大量的時間,還不一定得到滿意的檢索效果。為了提高檢索效率,人們開始利用光電技術機械技術,設計製造了檢索工具。但這種檢索工具還沒有廣泛地推開,就被計算機檢索系統所代替了。在我國沒有經歷這一過程,就直接進入了計算機檢索階段,更確切地說是進入了計算機網路檢索階段。
3.計算機檢索階段
以計算機技術為主的現代信息技術的發展是計算機信息檢索進步的基礎。1946年第一台電子計算機誕生以後不久,就將其用於了信息檢索,開創了現代信息檢索的先河。自那以後,出現了一系列信息存儲與檢索的新理論和新方法,已經逐漸成為一門獨立的科學分支。從單機批處理時期(20世紀50年代初至60年代中期),在線上檢索試用時期(60年代中期至70年代中期),一直到在線上服務系統(70年代中期至80年代中期)。信息存儲介質也從磁帶磁碟光碟,發生根本性的變化,其存儲模式也從檔案形式發展到以資料庫為核心。從系統結構來看,從脫機檢索發展到在線上檢索,基本上是與計算機技術的發展相併行的。
早在20世紀50年代初期,美國麻省理工學院的P.R.Bagley就開始利用計算機檢索進行代碼化文摘的可行性研究實驗。1954年,美國馬里蘭州銀泉海軍軍械試驗室利用IBM701型電子計算機,將文獻號和少量標引詞存儲在計算機中,進行相關性比較後輸出檢索結果——文獻號,由此誕生了世界上第一個文獻信息的自動化檢索系統。由於當時的計算機尚處在電子管時期,用於信息處理有很大的局限,因此無實用系統,而且是脫機檢索。
20世紀50年代末到60年代初,由子第2代計算機(半導體)的軟硬體有了發展,文獻處理與信息檢索的性能增強,信息檢索進入到實用化的脫機批處理階段。1959年,美國的勞恩利用IBM 650型計算機建立了世界上第一個基於KWIC關鍵字索引的定題檢索SDI系統。1961年,美國《化學文摘》社使用計算機編制《化學題錄》(Chemical Title),並發行《化學題錄》機讀磁帶版。自此以後,計算機信息存取在世界範圍內正式進入到實際套用與生產型開發的新時期。1967年以後,美國《化學文摘》社整個系列的新出版物都通過機讀資料庫進行生產了。1963年,美國系統發展公司受國防部委託開始研製ORBIT計算機存取系統並獲得成功。1964年,美國國家醫學圖書館也開始使用計算機編制世界醫學文獻的檢索刊物《醫學索引》(Index Medics)並投入使用。
到了20世紀60年代後期,由於第3代積體電路計算機的誕生與高密度海量存儲器硬磁碟及磁碟機的問世,以及數字通信技術和分組交換公用數據通信網的普及,使計算機信息存取從脫機批處理進入到在線上檢索階段。最早的在線上信息存取系統是美國洛克希德(Lockheed)公司研究試驗室研製的CONVERS系統,該系統經過不斷試驗與改進以後,於1966年改名為DIALOG,1967年開始為NASA提供常規檢索服務。

目標

狹義地講,信息檢索系統的目標是使特定的信息用戶能夠在特定的時間和地點、以特定的方式和方法獲得特定的信息,從而滿足其信息需求。換句話說,在用戶給出查詢後,信息檢索系統的首要目標就是檢索出可能對用戶有用或相關的信息。廣義地講,信息檢索系統的目標是將作者表達的思想與用戶對該思想的需求進行匹配,即在信息創造者或生成者與該信息的用戶之間建起橋樑。

職能

(1)存儲職能。把有關信息的學科內容特徵和外部特徵著錄下來,按一定次序排列組織起來,以便於查找各類信息資源。
(2)檢索職能。提供一定的檢索手段,使人們按照一定的檢索方法,及時、準確、全面地查找出所需信息資源。
(3)報導職能。揭示某一時期、某一範圍信息資源的發展狀況。通過檢索系統對信息資源的報導,了解學科的歷史、現有水平和未來發展趨勢。

分類

1、按照檢索的功能劃分
可以分為書目檢索系統事實數據檢索系統,書目檢索系統主要是對某一研究課題的相關義獻進行檢索,其結果是獲得一批相關文獻的線索,其檢索作業的對象是檢索工具。事實數據檢索系統用於各種事實或數據的檢索.如查找某一詞的解釋,某人、某時間、某地名、某企業及其產品情況等.其結果是獲得直接的、可供參考的答案。進行事實數據檢索時.使用各種參考工具.如字典、百科全書年鑑手冊名錄或者相應的資料庫
2、 按照檢索的手段劃
可以分為手工檢索系統計算機檢索系統。手工檢索系統是以手工方式存儲和檢索信息的系統。檢索時使用各種紙質工具.檢索入口少、速度慢、效率低。計算機檢索系統是用計算機進行信息存儲和檢索的系統,檢索時使用各種資料庫,檢索靈活、檢索入口多、速度快、效率高。由於計算機檢索具有速度快、效率高、數據內容新、範圍廣、數量大、操作簡便、檢索時不受國家和地理位置的限制等特點,已成為人們獲取信息的主要手段之一。

結構

1.物理結構
信息檢索系統的物理結構是信息檢索所用的硬體資源(如計算機、網路)、系統軟體(如Windows系列軟體)及信息資源集合(資料庫)的總和。
2.邏輯結構
信息檢索系統的邏輯結構指系統所包括的功能模組或子系統及其相互關係。包括信息資源選擇與採集子系統、信息標引子系統、詞表管理子系統、資料庫創建與維護子系統、提問處理子系統和用戶檢索接口子系統。

相關詞條

熱門詞條

聯絡我們