數據分組

數據分組

數據分組是根據統計研究的需要,將原始數據按照某種標準劃分成不同的組別,分組後的的數據稱為分組數據。數據分組的方法有單變數值分組和組距分組兩種。數據分組的主要目的是觀察數據的分布特徵,在進行數據分組後再計算出各組中數據出現的頻數就形成了一張頻數分布表。

基本介紹

  • 中文名:數據分組
  • 外文名:data grouping
  • 主要目的:觀察數據的分布特徵
  • 分組方法:單變數值分組和組距分組
  • 分組原則:遵循不重不漏
  • 分組體系:平行分組體系、複合分組體系
簡介,分組原則,窮盡性原則,互斥性原則,分組標誌,分組方法,單變數值分組,組距分組,數據分組體系,平行分組體系,複合分組體系,

簡介

對於通過調查得到的數據,雖然經過審核、排序等整理手段給予了處理,但由於數據龐雜,還不能直接進入對數據的分析階段。在此之前,有必要對數據進行分組處理,以反映數據分布的特徵及規律。從一定意義上說,數據整理的中心任務就是分組和編制頻數分布。
數據分組是根據統計研究的需要,將原始數據按照某種標準劃分成不同的組別,分組後的數據稱為分組數據。數據分組的主要目的是觀察數據的分布特徵。數據分組後再計算出各組中數據出現的的頻數就形成了一張頻數分布表。
對於非數值型數據就是依據屬性的不同將其劃分為若干組,對於數值型數據就是依據數值的不同將數據劃分為若干組。分組後,要使組內的差距儘可能小,而組與組之間則有明顯的差異,從而使大量無序、混沌的數據變為有序、層次分明、顯示總體數量特徵的資料。因為,任何總體內部單位之間都是既有共性,又存在著差異性,分組便是以這些共性與差異性的對立統一為基礎的最基本的整理方法,它對於自然科學和社會科學的研究都是必不可少的。
在社會經濟統計研究中,數據分組的作用在於:劃分現象的類型、研究總體的結構與現象之間的依存關係。

分組原則

數據分組應遵循兩個基本原則:

窮盡性原則

這一原則就是要求調查的每一單位都能無一例外地劃歸到某一組去,不會產生“遺漏”現象。

互斥性原則

這一原則就是要求將調查單位分組後,各個組的範圍應該互不相容、互為排斥。即每個調查單位在特定的分組標誌下只能歸屬某一組,而不能同時或可能同時歸屬到幾個組。

分組標誌

在選擇分組標誌時,主要有以下三個依據:
1.根據研究目的選擇分組標誌
同一現象由於研究目的不同,選擇的分組標誌也就不同,應選擇與研究目的有密切關係的標誌作為分組標誌,才能使統計分組提供符合要求的分組資料。例如,要研究工業企業經濟類型的構成,就要選擇所有制這個標誌。
2.選擇能夠反映現象本質的標誌
客觀現象的標誌多種多樣,有的標誌能夠揭示現象的本質特徵,具有決定意義的重要標誌;有的則是非本質、無關緊要的標誌。只有選擇那些能夠揭示現象本質特徵的重要標誌作為分組標誌,才能得到反映現象本質特徵的分組資料。
3.考慮現象所處的歷史條件或經濟條件
社會經濟現象隨時間、地點、條件的不同而經常發生變化。同一分組標誌在某一時期適用,在另一時期就不一定適用,在另一條件下就不一定適用。某一標誌在一定歷史條件下是重要的分組標誌,但時過境遷,可能失去其重要意義。因此,在選擇分組標誌時,應考慮到現象所處的具體歷史條件或經濟條件,做到與時俱進。

分組方法

數據分組的方法有單變數值分組和組距分組兩種。

單變數值分組

單變數值分組是把一個變數值作為一組,這種分組通常值適合離散變數,而且在變數值較少的情況使用。

組距分組

在連續變數或變數值較多的情況下,通常採用組距分組。它是將全部變數值依次劃分為若干區間,並將這一區間的變數值作為一組。在組距分組中,一個組的最小值稱為下限;一個組的最大值稱為上限
具體的分組步驟如下:
第1步:確定組數。一組數據分多少組合適呢?一般與數據本身的特點及數據的多少有關。由於分組的目的之一是觀察數據分布的特徵,因此組數的多少應適中。如果組數太少,數據的分布就會過於集中,組數太多,數據分布就會過於分散,這都不便於觀察數據分布的特徵和規律。組數的確定應以能夠顯示數據的分布特徵和規律為目的。一般情況下,一組數據所分的組數應不少於5組且不多於15組。實際套用時,可根據數據的多少和特點及分析要求來確定組數。
第2步:確定各組的組距。組距是一個組的上限與下限的差。組距可根據全部數據的最大值和最小值及所分的組數來確定,及組距=(最大值-最小值)/組數。
第3步:根據分組整理成頻數分布表。

數據分組體系

有時為了從不同側面反映總體的特徵,就必須運用幾個標誌對總體進行分組,以形成一個完整的體系,這就是數據分組體系。數據分組體系有兩種不同的形式:

平行分組體系

將數據按照一個標誌進行分組,就稱為簡單分組。將一個總體的幾個簡單分組按照某一規則排列起來就構成了一個平行分組體系。例如,分別按性別、專業、年級對大學生進行分組,這些簡單分組排列起來,就是平行分組體系。

複合分組體系

將數據同時按兩個或兩個以上的標誌層疊起來分組,就稱為複合分組。由複合分組形成的分組系列就稱為複合分組體系。例如,對工業企業先按所有制分組,在此基礎上,再按規模進行複合分組,就形成一個複合分組體系。

相關詞條

熱門詞條

聯絡我們