機讀數據文檔

機讀數據文檔

機讀數據文檔也稱機讀檔案資料庫,簡稱檔案資料庫,是以一定的組織方式存儲在一起的機讀檔案數據的集合,這些數據包括檔案題名、責任者、來源、頁碼、分類號,主題詞、摘要等,少數包含檔案全文。資料庫記錄的各個項目稱為欄位,在長度上可以是固定的,也可以是可變的,這些記錄可以被組織起來以供檢索和顯示之用。具體來說,檔案資料庫是機讀版的檔案文摘、索引、目錄、文本及其他數據彙編。它是檔案計算機檢索系統必不可少的信息資源,是檔案計算機檢索系統的核心部分,其性能往往影響到整個系統的功能效率。

基本介紹

  • 中文名:機讀數據文檔
  • 外文名:Machine readable data documents
  • 定義:存儲在一起的機讀檔案數據的集合
  • 別名:機讀檔案資料庫
  • 結構:物理資料庫、概念資料庫等
  • 學科:計算機技術
結構,特點,分類,

結構

完整的檔案資料庫系統由檔案資料庫和檔案資料庫管理系統兩大部分組成。
檔案資料庫由若干檔案數據文檔組成,用來存儲與檔案檢索有關的所有數據。其結構分為三層:
1.物理數據厙
這是最內一層,它是物理設備上實際存儲的數據集合,包含資料庫系統使用的全部數據,又稱物理模式或存儲模式。它與用戶沒有直接的聯繫。
2.概念資料庫
這是中間層,它是整體資料庫的邏輯表示,指出每一個數據的邏輯定義以及數據間的邏輯聯繫,又稱概念模式或全局邏輯資料庫。
3.邏輯資料庫
這是最外一層,也是最靠近用戶的一層,是全局邏輯資料庫的一部分,是某一特定用戶所使用的數據集合的邏輯表示,又稱子模式,外模式或局部邏輯資料庫。子模式是用戶和資料庫的接口。
檔案資料庫管理系統(DBMS)是為建立、使用和維護資料庫而配置的軟體。它建立在作業系統的基礎上,對資料庫進行統一的管理和控制。用戶使用數據的各種命令以及運行應用程式,都要通過資料庫管理系統來傳達。它還承擔著資料庫的維護工作,以確保資料庫的完整性、一致性和安全性。具體來說,資料庫管理系統具備以下功能:
1.描述資料庫:對資料庫三級模式的描述及建庫。
2,管理資料庫:控制整個資料庫系統的運行;控制用戶的並發性訪問;數據的存取及更新處理;執行對數據的使用與操作等。
3.維護資料庫:確保數據的完整性、安全性和保密性;資料庫恢復和性能監視等。
4.數據通訊:負責處理收據的流動。
資料庫管理系統還具備與作業系統的在線上處理功能,具備分時系統及遠程作業輸出的相應接口功能。

特點

1.集成式。檔案資料庫對檔案數據實行集中化控制,可將各種有關數據集中在一起進行統一的控制和管理,保證了數據的一致性、完整性。
2.結構化。檔案數據具有複雜的數據結構,它將各套用系統的全部數據合理地組織起來。 ·
3.低冗餘度。資料庫中的檔案數據重複少,數據的冗餘度被控制在最低限度,節省了計算機存儲空間。
4.可靠性。資料庫系統採取各種手段加強了對數據的保護,保證了數據的安全可靠。
5.共享性。資料庫系統內的各應用程式可以共用,資料庫還可當作商品出售,供不同用戶、不同系統使用。

分類

一般將資料庫所含信息內容作為檔案資料庫的基本分類標準,根據此標準,檔案資料庫可分為:
1.二次文獻資料庫。包括各種機讀版的文摘、索引、目錄等,又稱目錄資料庫。其作用在於指引用戶找到合適的檔案信息源,也就是檔案原文,從而滿足其檢索要求。
2.事實資料庫。又稱文本數值資料庫,是同時包含文本信息和數值信息的資料庫,它提供經過加工的一次情報,利用者可直接從中查找自己所需要的檔案信息。
3.全文資料庫。存儲機讀化的檔案全文,可用來檢索檔案原文中的任何字、句、段,節、章等。 ;
事實資料庫和全文資料庫統稱源資料庫,其特點在於它本身含有一次情報,即用戶所要求獲取的數值、事實或文本,可直接向用戶提供所需的檔案信息。它相對於二次文獻資料庫來說,是在更深層次上對檔案信息進行加工的產物。源資料庫近些年來發展很快。
按數據形式分,檔案資料庫還可分為文字型資料庫、數值型資料庫、圖像型資料庫等。近年來又出現了將文本、數值數據、圖像圖形、聲音結合在一起的多介質資料庫,這種資料庫不僅能提供靜態的文本、數字或表格,還可聞其聲、見其形,是多媒體技術發展的產物。

相關詞條

熱門詞條

聯絡我們