文獻加工系統

文獻加工系統,加工文獻以生成全文資料庫或書目文摘資料庫的計算機系統。

基本介紹

  • 中文名:文獻加工系統
  • 所屬類別:網路技術
構成
通常由以下幾個子系統構成:
①數位化信息生成和採集子系統。主要有兩個功能:一是將現存的以不同形式和載體存儲的信息資料,如紙質資料、圖片、聲像資料等轉化成數字形式,使用的技術有文字圖像掃描處理、圖像和語言的識別等。另一個功能是直接獲取已經數位化的資料。
②數據處理子系統。對數據進行去噪、壓縮、加密、格式轉換等處理,做到既有利於讀者閱讀,又能保護數字資料內容原創者或擁有者的利益。
③元數據提取與加工子系統。基本功能是提取和生成元數據,對原始文獻進行描述,這部分工作既可以手工完成,也可以自動化的方式(如自動標引、自動文摘)完成,常用的方法是在機器輔助下進行人工提取。
④數據存儲與管理子系統。文獻加工系統所形成的資料庫一般都擁有海量信息,數據存儲與管理子系統一方面要保證海量信息存儲有序,另一方面還要保證不會影響讀取速度和服務效果。同時,還涉及數據的標識指引,即用數字對象唯一標識符來標識系統中的數字對象,以方便人們的利用,目前數字對象唯一標識符有多種方案如URN、PURL、HandleSystem等。
⑤管理子系統。包括工作人員管理,加工任務分配、工作量統計、資料庫維護等。

相關詞條

熱門詞條

聯絡我們