聚類取樣(Cluster Sampling)又稱整群抽樣。是將總體中各單位歸併成若干個互不交叉、互不重複的集合,稱之為群;然後以群為抽樣單位抽取樣本的一種抽樣方式。套用整群抽樣時,要求各群有較好的代表性,即群內各單位的差異要大,群間差異要小。
基本介紹
- 中文名:聚類取樣
- 外文名:Cluster Sampling
- 心理學:心理統計
定義,實施步驟,適用情況,優缺點,誤差,取樣的分類,隨機抽樣法,非隨機抽樣法,
定義
實施步驟
先將總體分為i個群,然後從i個群中隨機抽取若干個群,對這些群內所有個體或單元均進行調查。抽樣過程可分為以下幾個步驟:
1、確定分群的標註
2、總體(N)分成若干個互不重疊的部分,每個部分為一群。
3、據各樣本量,確定應該抽取的群數。
4、採用簡單隨機抽樣或系統抽樣方法,從i群中抽取確定的群數。
例如,調查中學生患近視眼的情況,抽某一個班做統計;進行產品檢驗;每隔8h抽1h生產的全部產品進行檢驗等。
適用情況
整群抽樣方法的運用,需要與分層抽樣方法區別。
當某個總體是由若干個有著自然界限和區分的子群(或類別、層次)所組成,同時,不同子群相互之間差很大、而每個子群內部的差異不大時,則適合於分層抽樣的方法;反之,當不同子群之間差別不大、而每個子群內部的異質性比較大時,則特別適合於採用整群抽樣的方法。
優缺點
誤差
整群抽樣的誤差視各群單位方差大小而定,各群單位方差的簡單平均數是計算其抽樣平均誤差的依據。從公式上看,整群抽樣平均誤差的公式與類型抽樣平均誤差的公式相似,用R表示全及總體中劃分的群(組)數。r表示被抽中的群(組)數。表示抽樣總體各群(組)方差的平均數。
取樣的分類
隨機抽樣法
調查對象總體中每個部分都有同等被抽中的可能,是一種完全依照機會均等的原則進行的抽樣調查方法。隨機抽樣法主要有簡單隨機抽樣、系統抽樣、分組抽樣、分層抽樣四種。
是指從總體N個單位中任意抽取n個單位作為樣本,使每個可能的樣本被抽中的機率相等的一種抽樣方式。簡單隨機抽樣的缺陷在於事先要把研究對象編號,比較費時、費力。當樣本容量較小時,可能發生偏向,影響樣本的代表性。
是指先將總體的全部單元按照一定順序排列,採用簡單隨機抽樣抽取第一個樣本單元(或稱為隨機起點),再順序抽取其餘的樣本單元的一種抽樣方式。相對於簡單隨機抽樣方式,系統抽樣最主要的優勢就是經濟性。等距抽樣方式比簡單隨機抽樣更為簡單,花的時間更少,並且花費也少。使用等距抽樣方式最大的缺陷在於總體單位的排列上。
③分組抽樣(又稱整群抽樣)
即按照某一標準將總體單位分成“群”或“組”,從中抽選“群”或“組”,然後把被抽出的“群”或“組”所包含的個體合在一起作為樣本,被抽出的“群”或“組”的所有單位都是樣本單位,最後利用所抽“群”或“組”的調查結果推斷。這種抽樣方法的優點是實施方便、節省經費。缺點是往往由於不同群之間的差異較大,由此而引起的抽樣誤差往往大於簡單隨機抽樣、樣本分布面不廣、樣本對總體的代表性相對較差等。
④分層抽樣
是從一個可以分成不同子總體(或稱為層)的總體中,按規定的比例從不同層中隨機抽取樣品(個體)的方法。這種方法的優點是,能夠避免簡單隨機抽樣中樣本集中於某種特性或缺少某種特性的現象,樣本的代表性比較好,抽樣誤差比較小。缺點是抽樣手續較簡單隨機抽樣還要繁雜些。
非隨機抽樣法
抽樣時不是遵循隨機原則,而是按照研究人員的主觀經驗或其它條件來抽取樣本的一種抽樣方法。主要有偶遇抽樣、判斷抽樣、等額抽樣、滾雪球抽樣。
①偶遇抽樣
是指完全按調查者的意願選取樣本的一種方法。這種抽樣方法的優點是方便、靈活,簡便易行,及時取得所需資料,節約時間和費用成本低。缺點是由於個體差異性,抽樣誤差很大,結果不夠可靠,套用價值較低。
②判斷抽樣
是指由市場調查的專家依據自己的判斷來選取樣本的一種方法。優點是按照調查人員的需要來選定樣本,所以較好地滿足了特殊的調查需要。缺點是如果調查人員在選取樣本時主觀判斷出現偏差,則判斷抽樣極易發生較大的抽樣誤差。
③等額抽樣(配額抽樣)
是指按照一定的標準確定地區別和職業別等不同群體的樣本配額,然後由調查人員主觀地抽取配額內樣本的方法。這種抽樣適用於設計調查者對總體的有關特徵具有一定的了解而樣本數較多的情況下,實際上,配額抽樣屬於先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個體)。優點是費用不高,易於實施,能滿足總體比例的要求。缺點是容易掩蓋不可忽略的偏差。
是指先隨機選擇一些被訪者並對其實施訪問,再請他們提供另外一些屬於所研究目標總體的調查對象,根據所形成的線索選擇此後的調查對象的抽樣方法。這種抽樣方法的優點是調查費用大大減少,缺點是樣本很可能出現偏差,不能很好地代表整個總體。