國家排放數據系統

國家排放數據系統

國家排放數據系統是指用於存儲國家各種排放數據的資料庫系統。國家排放數據系統存儲的排放數據有廢水、廢氣排放總量、廢水中主要污染物排放量、廢氣中主要污染物排放量、固體廢物利用情況、空氣品質指標、生活垃圾清運和處理情況。

基本介紹

  • 中文名:國家排放數據系統
  • 外文名:National emission data system
  • 學科:計算機
  • 定義:存儲國家排放數據的資料庫系統
  • 有關術語:資料庫系統
  • 領域:資料庫
簡介,資料庫系統,定義,組成,數據挖掘,對象,數據挖掘功能,數據挖掘過程,

簡介

國家排放數據系統是指用於存儲國家各種排放數據的資料庫系統。國家排放數據系統方便對各種排放數據檢索和管理,為以後各種污染排放工作打好基礎。國家排放數據系統存儲大量數據,可以通過數據分析或數據挖掘發現國家污染排放總量未來發展趨勢。

資料庫系統

定義

資料庫系統是指在計算機系統中引入資料庫後構成的系統,一般由資料庫、資料庫管理系統(及其開發工具)、套用系統、資料庫管理員和用戶構成。資料庫系統是一個由硬體、軟體(作業系統、資料庫管理系統和編譯系統等)、資料庫和用戶構成的完整計算機套用系統。資料庫是資料庫系統的核心和管理對象。因此,資料庫系統的含義已經不僅僅是一個對數據進行管理的軟體,也不僅僅是一個資料庫,資料庫系統是一個實際運行的,按照資料庫方式存儲、維護和向套用系統提供數據支持的系統。

組成

數據
數據是指資料庫系統中集中存儲的一批數據的集合。它是資料庫系統的工作對象。為了把輸入、輸出或中間數據加以區別,我們常把資料庫數據稱為“存儲數據”、 “工作數據”或“運算元據”。它們是某特定套用環境中進行管理和決策所必需的信息。特定的套用環境,可以指一個公司、一個銀行、一所醫院,或一所學校等各種各樣的套用環境。在這些各種各樣的套用環境中,各種不同的套用可通過訪問其資料庫獲得必要的信息,以輔助進行決策,決策完成後,再將決策結果存儲在資料庫中。特別需要指出的是,資料庫中的存儲數據是“集成的”和“共享的”。所謂“集成”,是指把某特定套用環境中的各種套用相關的數據及其數據之間的聯繫(聯繫也是一種數據)全部地集中地並按照一定的結構形式進行存儲,或者說,把資料庫看成為若干單個性質不同的數據檔案的聯合和統一的數據整體,並且在檔案之間局部或全部消除了冗餘。這使資料庫系統具有整體數據結構化和數據冗餘小的特點。所謂“共享”,是指資料庫中的一塊塊數據可為多個不同的用戶所共享,即多個不同的用戶,使用多種不同的語言,為了不同的套用目的,而同時存取資料庫,甚至同時存取同一塊數據。共享實際上是基於資料庫是“集成的”這一事實的結果。
用戶
用戶是指存儲、維護和檢索資料庫中數據的使用人員。資料庫系統中主要有 3 類用戶:終端用戶、應用程式員和資料庫管理員。
終端用戶:是指從計算機在線上終端存取資料庫的人員,也可稱為在線上用戶。這類用戶使用資料庫系統提供的終端命令語言、表格語言或選單驅動等互動式對話方式來存取資料庫中的數據。終端用戶一般是不精通計算機和程式設計的各級管理人員、工程技術人員或各類科研人員。終端用戶有時也稱最終用戶。
應用程式員:是指負責設計和編制應用程式的人員。 這類用戶通過設計和編寫 “使用及維護”資料庫的應用程式來存取和維護資料庫。這類用戶通常使用 Access、PB 或 Oracle 等資料庫語言來設計和編寫應用程式,以對資料庫進行存取操作。應用程式員也稱為系統開發員。
資料庫管理員(DBA):是指全面負責資料庫系統的“管理、維護和正常使用的”人員。它可以是一個人或一組人。特別對於大型資料庫系統,DBA 極為重要,常設定有 DBA 辦公室,應用程式員是 DBA 手下的工作人員。擔任資料庫管理員,不僅要具有較高的技術專長,而且還要具備較深的資歷,並具有了解和闡明管理要求的能力。DBA 的主要職責有:參與資料庫設計的全過程,與用戶、應用程式員、系統分析員緊密結合,設計資料庫的結構和內容;決定資料庫的存儲與存取策略,使數據的存儲空間利用率和存取效率均較優;定義數據的安全性和完整性;監督控制資料庫的使用和運行,及時處理運行程式中出現的問題;改進和重新構造資料庫系統等。
軟體
軟體是指負責資料庫存取、維護和管理的軟體系統。通常叫做資料庫管理系統(Data Base Management System,DBMS)。資料庫系統各類用戶對資料庫的各種操作請求,都是由 DBMS 來完成的,它是資料庫系統的核心軟體。DBMS 提供一種超出硬體層之上的對資料庫的觀察的功能,並支持用較高的觀點來表達用戶的操作,使資料庫用戶不受硬體層細節的影響。DBMS 是在作業系統(OS)支持下工作的。
硬體
硬體是指存儲資料庫和運行資料庫管理系統 DBMS(包括作業系統)的硬體資源。它包括物理存儲資料庫的磁碟、 磁鼓、 磁帶或其他外存儲器及其附屬設備、 控制器、 I/O 通道、記憶體、CPU 及其他外部設備等。

數據挖掘

數據挖掘(Data Mining)就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際套用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。這個定義包括好幾層含義:數據源必須是真實的、大量的、含噪聲的;發現的是用戶感興趣的知識;發現的知識要可接受、可理解、可運用;並不要求發現放之四海皆準的知識,僅支持特定的發現問題。

對象

數據挖掘的對象可以是任何類型的數據源,可以是關係資料庫,此類包含結構化數據的數據源;也可以是數據倉庫、文本、多媒體數據、空間數據、時序數據、Web數據,此類包含半結構化數據甚至是異構型數據的數據源。發現知識的方法可以是數字的、非數字的,也可以是歸納的,最終被發現了的知識可以用於信息管理、查詢最佳化、決策支持及數據自身的維護等。

數據挖掘功能

目前數據挖掘的主要功能包括概念描述、關聯分析、分類、聚類和偏差檢測等。概念描述主要用於描述對象內涵並且概括此對象相關特徵,概念描述分為特徵性描述和區別性描述, 特徵性描述描述對象的相同特徵,區別性描述描述對象的不同特徵;關聯分析主要用來發現資料庫中相關的知識以及數據之間的規律,關聯分為簡單關聯、時序關聯、因果關聯;分類和聚類就是根據需要訓練相應的樣本來對數據分類和合併;偏差分析用於對對象中異常數據的檢測。

數據挖掘過程

數據挖掘主要分3個階段:數據準備、數據挖掘、結果的評價和表達。數據準備主要是完成對大量數據的選擇、淨化、推測、轉換、數據的縮減, 數據準備階段的工作好壞將影響到數據挖掘的效率和準確度以及最終模式的有效性,在數據準備階段可以消除在挖掘過程中無用的數據,從而提高數據挖掘的效率和準確度;數據挖掘的工作首先需要選擇相應的挖掘實施算法,例如決策樹、分類、聚類、粗糙集、關聯規則、神經網路、遺傳算法等,然後對數據進行分析,從而得到知識的模型;結果評價和表達主要是確定知識的模式模型是否有效以便發現有意義的模型。

相關詞條

熱門詞條

聯絡我們