內曼分配

內曼分配

分層隨機抽樣中,各層中每個單位費用一樣(即Ch=C)時樣本單位的最優分配方法。內曼分配是一種不等機率樣本設計,每個元素的抽樣機率取決於其所在層的元素個數和樣本量。

基本介紹

  • 中文名:內曼分配
  • 外文名:Neyman allocation
  • 所屬學科:數學
  • 所屬問題:統計學(抽樣方法)
  • 簡介:一種常用的非比例分層抽樣方法
  • 證明者:內曼(Neyman)、楚波羅
基本介紹,相關說明,相關概念,樣本分配方法,比例分配方法,

基本介紹

內曼分配是分層隨機抽樣中,各層中每個單位費用一樣(即
)時樣本單位的最優分配方法。設nh為各層的樣本含量,Nh為h層單位總數,Sh為h層標準差,n為樣本總含量(固定),內曼(Neyman)1934年證明,當
時,這種分配為最優分配即
達到最小值,因而命名為內曼分配。後來發現楚波羅(Tschuprow)1923年就給出了這一結論的證明。
最優分配
最優分配是指在分層抽樣中,在規定的抽樣費用下配置各層的樣本含量nh使
達到最小值,或在給定的
條件下選擇各層的樣本含量nh使費用最少的一種樣本單位分配方法。這樣決定的各層的樣本數為最優分配。可以證明
。這裡Nh為第h層的總體單位數,Sh為第h層的標準差,Ch為第h層的每單位調查費用。

相關說明

此方法由著名統計學家內曼在1934年提出,故取名內曼分配。內曼分配是一種常用的非比例分層抽樣方法,按此分配方法,第h層的樣本量
為:
式中,
,N為總體元素總數,Nh為第h層的元素個數。
內曼分配是一種不等機率樣本設計,每個元素的抽樣機率取決於其所在層的元素個數和樣本量。若層內採用簡單隨機抽樣,則同層內的各元素的抽樣機率相等,但不同層元素的抽樣機率通常並不相等。第h層第i個元素的抽樣機率為:
與比例分配公式進行比較可以看出,比例分配是內曼分配的一種特殊情況:若每個層的方差相等,內曼分配公式就演變為比例分配公式。顯然,內曼分配不僅考慮了各層的元素數量,而且考慮了各層方差的大小:方差大的層多分配樣本,方差小的層少分配樣本。
與比例分配進行比較,內曼分配考慮了某個指標的方差因素,因此能夠更有效地提高該指標以及與其相關程度較高的指標的抽樣精度。
然而,比例分配的效果是比較穩定的,總是高於或至少等於同等樣本量的簡單隨機抽樣的精度,但內曼分配不具有這一特徵,其效果可能高於比例分配,也可能低於比例分配,甚至低於簡單隨機抽樣。例如,當一項調查有多個指標——多目標時就可能存在這種情況:一方面,對於某個或某些指標,內曼分配是很好的樣本分配方法,抽樣精度明顯高於比例分配。另一方面,對於其他指標,內曼分配可能是一種很差的分配方法,抽樣精度甚至可能低於同等樣本量的簡單隨機抽樣。此外,內曼分配的效果還會受輔助信息質量的影響,如果抽樣框中的輔助信息與實際情況差異較大,預期的抽樣精度與實際抽樣精度會差異較大。
內曼分配的這些特點告訴我們,使用時要注意對其他指標抽樣精度的分析、測算,避免顧此失彼,導致一些指標精度很高,另一些指標精度很低。同時要保證樣本量有一定量的富餘,以避免實際抽樣精度明顯低於預期抽樣精度的情況發生。

相關概念

樣本分配方法

分層抽樣的效果與分層的效果有關,同時與樣本分配方法有關。如何在各層中分配樣本,或者說不同分配方法,其產生的效果是不同的。分配方法有多種,在企業調查中最常用的是比例分配方法和內曼分配方法。

比例分配方法

比例分配重在考慮層內的單位數,單位數多的層多分配樣本,單位數少的層少分配樣本。各層的單位數與樣本單位數之比相等,也即在各層具有同樣的抽樣比。例如,總體共有N個企業,準備抽取n個企業;第h層的企業數為Nh,樣本量為nh,按比例分配則要求:
或:
比例分配是一種等機率樣本設計,即每個樣本單位的抽樣機率相等。若各層內採用簡單隨機抽樣,則每個樣本單位的抽樣機率為:
抽樣理論告訴我們,採用比例分配的分層抽樣,其抽樣精度總是高於或至少等於同等樣本量的簡單隨機抽樣。或者說比例分配抽樣的設計效應總是小於等於1,即deff≤1。
比例分配究竟能夠在多大程度上提高抽樣精度,則完全取決於層內各單位之間的差異程度。各層內單位的同質性程度越高——差異越小,比例分配抽樣的效果越好。換句話說,層分得越好——各層內同質性程度越高,比例分配抽樣在抽樣精度上的獲益越大。
分層抽樣通過兩種途徑提高抽樣精度:一是將單位差異較小或較為相近單位放在同一個層,減少層內方差;二是在總樣本量不變的情況下,控制各層中的樣本量。顯然,採用比例分配時,抽樣精度的獲益主要來自於第一種途徑,即同質性分層。然而在許多情況下,使用非比例抽樣,給方差大的層多一些樣本,而給方差小的層少一些樣本,可以進一步提高抽樣精度。

相關詞條

熱門詞條

聯絡我們