統計資料庫

統計資料庫

統計資料庫是指一種用來對統計數據進行存儲、統計、分析的資料庫系統。研究統計資料庫的目的,就是根據統計數據的基本屬性,以及統計數據處理的性質任務,構建一種符合統計數據處理基本要求的統計數據管理模式。

基本介紹

  • 中文名:統計資料庫
  • 外文名:statistical database
  • 作用:存儲、管理、分析統計數據
  • 特點:多維性等
  • 對象:統計數據
  • 學科:統計學
簡述,特點,設計,相關技術,

簡述

統計數據是國家社會經濟信息的主體,也是企業經營管理信息的主體,同時也是科學研究信息的主體,所以統計資料庫建設是國家和企業信息化發展的重要環節;統計資料庫套用系統是現代統計建設的關鍵部分,因此統計資料庫技術的研究對統計資料庫的套用開發具有重要意義。
統計資料庫技術是與統計處理對象即統計數據的特徵和一般處理功能相關的技術,由統計資料庫、統計資料庫管理系統、統計套用開發技術與統計數據處理技術組成的計算機套用系統技術。
統計資料庫是存儲、管理、分析統計數據的資料庫系統,是統計數據採集和統計數據傳送的歸宿,是統計數據存儲和統計數據管理根本手段,是提供數據分析和數據服務基礎,是綜合套用現代計算機的軟、硬體技術、網路通信技術,經過分類、整理、匯總等加工,按照一定的數據模型,彙編成計算機可讀的、便於修改、管理和檢索的統計數據集合。

特點

統計資料庫是一種用來對統計數據進行存貯、統計(如求數據的平均值、最大值、最小值、總和等等)、分析的資料庫系統,其特點如下:
第一,多維性是統計數據的第一個特點,也是最基本的特點。
第二,統計數據是在一定時間(年度、月度、季度)期末產生大量數據,故入庫時總是定時的大批量載入。經過各種條件下的查詢以及一定的加工處理,通常又要輸出一系列結果報表。這就是統計數據的“大進大出”特點。
第三,統計數據的時間屬性是一個最基本的屬性,任何統計量都離不開時間因素,而且經常需要研究時間序列值,所以統計數據又有時間向量性。
第四,隨著用戶對所關心問題的觀察角度不同,統計數據查詢出來後常有轉置的要求。

設計

統計資料庫的設計包括有數據管理要求的分析、建立資料庫的概念模型、邏輯資料庫設計及物理資料庫設計等階段。
1.對資料庫管理要求的分析。設計資料庫時,首先要考慮到對數據要求的分析。對數據管理要求的分析主要包括對信息的要求和對處理的要求。對信息的要求分析,就是要分析統計分析人員對要建立的資料庫的數據有何要求,包括分析管理人員將要從資料庫中得到什麼信息,以及對數據的可靠性、保密性、安全性等方面的要求。對處理的要求分析是指對用戶要求完成什麼處理功能進行分析,包括由最高管理人員提出的管理策略要求;由中層管理人員提出的控制要求;及由基層統計分析人員提出的操作要求等。根據不同的處理要求。確定各種不同的處理方式。進行處理描述。
2.在分析的基礎上建立一個資料庫的概念模型。分析工作可以通過基本的統計信息及能夠說明統計信息特性的屬性來進行。通過分析,確定其基本的信息,及信息資料之間的關係。從而明確數據定義狀態、綜合各種數據的特徵,建立基本的數據結構。
3.邏輯資料庫的設計。這一階段的主要目標是產生一個計算機能夠接受。資料庫管理系統能處理的模式,即把第二階段建立的與資料庫管理系統無關的概念模型,轉換為與選用的資料庫管理系統所支持的數據模型相符的模式,這個模式不僅要滿足用戶對資料庫的套用要求,還要滿足將來發展的要求。此外,實現設計還要解決數據的完整性、一致性、可恢復性、安全性和有效性問題。
4.物理設計。這是整個資料庫設計過程的最後階段。確定資料庫的物理結構。包括資料庫在物理設備上的存儲結構和存取方式,要求提供數據量特性、處理量特性、資料庫系統特性等各種設計參數。這階段設計的目的是完成一個具體的資料庫管理系統可接受的物理結構。

相關技術

(1)數據模型
為了適應統計數據的特點,應當採用與常規資料庫不同的數據模型。
表示實體類型及實體類型間聯繫的模型。它可分為兩種類型:概念數據模型和結構數據模型。
概念模型:這是一種獨立於計算機系統的模型。它不涉及信息在系統中的表示,只是用來描述某個特定組織所關心的信息結構。概念模型強調語義表達功能,它是現實世界的第一層抽象。
概念模型是對真實世界中問題域內的事物的描述,不是對軟體設計的描述。概念模型不依賴於具體的討‘算機系統,他是純粹反映信息需求的概念結構。
結構數據模型:它是直接面向資料庫的邏輯結構,是現實世界的第二層抽象。這類模型涉及到計算機系統和資料庫管理系統,所以稱為“結構數據模型”。結構數據模型應包含:數據結構、數據操作、數據完整性約束i部分。它主要有:層次、網狀、關係三種模型。
(2)統計數據的物理組織
統計數據的多維性和稀疏性對數據的物理組織提出了很多新的要求,其中主要的技術包括:
數據壓縮:統計資料庫需要數據壓縮的原因是統計資料庫中分類屬性數常常很多,有時可達數百個,而且分類屬性之重複出現的頻率極高,使得分類屬性的多維空間十分稀疏,因此數據壓縮和解壓縮是多維數據物理組織的重要技術。
數據壓縮的優點有:能減少存儲空間、增加數據傳輸率、加強保密性、減少後備副本和恢復費用等。
多維數據的物理組織:統計資料庫的多維性使得多維數據結構成為統計資料庫中重要的物理組織方法。
時序數據:統計數據的任何統計量都離不開時間因素,時間屬性是統計數據的一個最基本的屬性,從這個角度看,統計數據是時序數據。人們對時序數據的許多研究成果如時序數據操作(時序連線)、時序數據模型等都可以用到統計資料庫之中。

相關詞條

熱門詞條

聯絡我們