基本內容
現時人口調查的國家樣本為機率樣本,抽樣方式為多階段
整群抽樣。現時人口調查的國家樣本由兩個獨立的樣本構成,一個為“A設計”,另一個為“C設計”。兩個樣本合起來用於估計每個月勞動力的統計數據。
A設計樣本
A設計的第一階段是抽取初級抽樣單位(簡稱PSU)。在現時人口調查中,PSU一般為一個標準都市統計區或者為一個到幾個相鄰縣的集合體。此外,為了減少
抽樣誤差,還要使每個PSU中的各縣儘量在經濟類型、人口、種族等方面存在較大的差異。這是因為現時人口調查的抽樣方式為多階段
整群抽樣。在整群抽樣中,群內方差大,而群間方差小,可以降低
抽樣方差。全美的所有PSU按照所包含人口數的多少劃分為若干層,然後從每層中抽取一個PSU。層數是根據抽樣方差的要求及調查費用的多少來確定的。為了保證人口數多的PSU都能被抽中,又將所有的PSU按人口數目分為兩類,人數超過25萬的PSU稱為“自我代表的初級抽樣單位”,其餘的稱為“非自我代表的初級抽樣單位”。樣本中包括全部的“自我代表的初級抽樣單位”。而“非自我代表的初級抽樣單位”則組合成人口數目大致相等的層,再從中抽取PSU。A設計的第二階段是在每個抽中的PSU中抽取地址(居住單位)樣本。每四個相鄰的居住單位構成一個
子群,也就是現時人口調查中的“最終抽樣單位(簡稱USU)”。調查員或登門調查,或利用郵寄方式對每個抽中的USU中的全部住戶進行調查,取得原始數據。可見A設計是一種兩階段的
隨機抽樣方案。
C設計樣本
C設計是一種兩階段的抽樣。第一階段抽取PSU,第二階段抽取USU。C設計的第一階段抽取PSU,也將所有的PSU分為“自我代表的初級抽樣單位”和“非自我代表的初級抽樣單位”。樣本中包括全部的“自我代表的初級抽樣單位”。但C設計包含的“非自我代表的初級抽樣單位”數目為A設計的一半。抽取“非自我代表的初級抽樣單位”時,先把A設計的各層兩兩配對,然後再從配對層中各抽取一個PSU。C設計的第二階段也同A設計一樣,是從抽中的PSU中抽取USU,A設計與C設計抽取USU數目之比為2:1。
調查步驟
根據原始數據,得到每個月勞動力人數的簡單無偏估計;
調查由於各種原因造成的“未訪問”誤差,“未訪問”是指不能得到樣本中某個合乎要求的調查戶的回答;
進行第一階段的比率估計,以減少PSU間的抽樣方差;
利用複合估計方法,以更好地估計勞動力人數在月與月之間的變化;
對複合估計值進行季節調整,得出最後用於公布的估計數字。
偏差原因
由於調查覆蓋不全造成的偏差;
由於不回答而造成的偏差;
回答誤差造成的偏差;
來自輪換組的偏差;
數據處理造成的偏差;
估計方法本身帶來的偏差。
作用
早在1940年3月,美國就開展了現時人口調查,該調查旨在估計美國及其各州16歲及以上人口的勞動力特徵,是美國就業、失業水平及其他重要勞動力統計數字的基本來源。繼美國之後,加拿大、日本、澳大利亞和英國先後於1945年、1947年、1960年和1973年開展了勞動力調查。美國、加拿大、日本和澳大利亞的勞動力調查每月進行一次,英國的勞動力調查每季度進行一次。除了上述五國之外,還有許多國家也開展了勞動力調查,所以開展勞動力調查是與國際接軌的需要。