比例抽樣

比例抽樣

比例抽樣是抽樣方法的一種,是指不考慮試樣變異性的大小,都按統一的比例進行抽樣。抽樣又稱取樣。從欲研究的全部樣品抽取一部分樣品單位。其基本要求是要保證所抽取樣品單位對全部樣品具有充分的代表性。

比例抽樣的典型方法就是分層比例抽樣,它是根據某些特定的特徵,將總體分為同質、不相互重疊的若干層,再從各層中獨立抽取樣本,是一種不等機率抽樣

基本介紹

  • 中文名:比例抽樣
  • 外文名:proportional sampling
  • 學科:數理科學
  • 類型:數學術語
  • 特點:按一定比例進行抽樣
  • 典型方法:分層比例抽樣
抽樣,簡介,分層比例抽樣,基於放回比例抽樣的再抽樣方法,

抽樣

抽樣又稱取樣。從欲研究的全部樣品抽取一部分樣品單位。其基本要求是要保證所抽取樣品單位對全部樣品具有充分的代表性。抽樣目的是從被抽取樣品單位的分析研究結果來估計推斷全部樣品特性,是科學實驗質量檢驗社會調查普遍採用的一種經濟有效的工作和研究方法
一般抽樣的過程如下:
1、界定總體
界定總體就是在具體抽樣前,首先對從總抽取樣本的總體範圍與界限作明確的界定。
2、制定抽樣框
這一步驟的任務就是依據已經明確界定的總體範圍,收集總體中全部抽樣單位的名單,並通過對名單進行統一編號來建立起供抽樣使用的抽樣框。
3、決定抽樣方案
4、實際抽取樣本
實際抽取樣本的工作就是在上述幾個步驟的基礎上,嚴格按照所選定的抽樣方案,從抽樣框中選取一個個抽樣樣單位,構成樣本。
5、評估樣本質量
所謂樣本評估,就是對樣本的質量、代表性、偏差等等進行初步的檢驗和衡量,其目的是防止由於樣本的偏差過大而導致的失誤。

簡介

比例抽樣是指不考慮試樣變異性的大小,都按統一的比例進行抽樣

分層比例抽樣

在分層抽樣中,採用分層比例抽樣可以提高樣本的代表性,及對總體數量指標的估計值的確定,避免出現簡單隨機抽樣中的集中於某些特性或遺漏掉某些特性。
它是根據某些特定的特徵,將總體分為同質、不相互重疊的若干層,再從各層中獨立抽取樣本,是一種不等機率抽樣分層抽樣利用輔助信息分層,各層內應該同質,各層間差異儘可能大。這樣的分層抽樣能夠提高樣本的代表性、總體估計值的精度和抽樣方案的效率,抽樣的操作、管理比較方便。但是抽樣框較複雜,費用較高,誤差分析也較為複雜。此法適用於母體複雜、個體之間差異較大、數量較多的情況。

基於放回比例抽樣的再抽樣方法

數據挖掘本質上作為一類數據分析方法,和統計學有著共同的目標:發現數據中的結構川。因而,基於數據挖掘的視角,對抽樣調查數據採用一些數據挖掘的方法進行分析,是可行的。然而,將數據挖掘方法套用於抽樣調查數據,有一個問題通常無法迴避,那就是樣本數據所對應的權數如何處理。
一般而言,數據挖掘問題常常針對總體數據,例如關於一個公司的所有職工數據,銀行信用卡中心資料庫的所有客戶數據,一家大型超市一個季度以來的所有顧客購買記錄等。在這種情形下,每一條記錄都是總體數據中的一個單元,得到的觀察值可以直接計算總體參數,無需進行統計推斷。
但數據挖掘方法也越來越多地套用於抽樣調查數據。與總體數據不同的是,抽樣調查當中,每個樣本單元的觀測值都是有權數的,權數表示的是每個樣本單元代表了總體中一定數目的單元,所以整個樣本就“代表”了整個總體。樣本單元的權數取決於抽樣設計。
因此,謝佳斌等提出採用放回的、與樣本單元權數大小成比例的再抽樣方法,簡稱PewwR再抽樣,來實現“事後‘自加權設計。實現“事後”自加權設計後的子樣本可忽略掉樣本權數,直接採用常規的圖示方法和數據挖掘算法進行分析。隨後,基於2007中國公民科學家質調查貴州省數據,通過模擬分析討論了PPWWR再抽樣子樣本的樣本且問題,發現max( n,5% N)(n為樣本大小,N為總體單元的個數)是一個比較合適的樣本量。這一結論可能為其他大型複雜抽樣調查數據的數據挖掘實施問題提供借鑑。

相關詞條

熱門詞條

聯絡我們