樣本容量

樣本容量

樣本容量是指一個樣本中所包含的單位數,一般用n 表示,它是抽樣推斷中非常重要的概念。樣本容量的大小與推斷估計的準確性有著直接的聯繫,即在總體既定的情況下,樣本容量越大其統計估計量的代表性誤差就越小,反之,樣本容量越小其估計誤差也就越大。

基本介紹

  • 中文名:樣本容量
  • 外文名:sample size
  • 又稱:樣本大小
  • 意義:一個樣本中所包含的個案或單元數
  • 因素:精確度、同質性、財力
  • 套用學科:統計學
簡介,解釋,詳細內容,相關定義,最優選擇,意義,樣本個數,公式和方法,公式,計算方法,相關資料,

簡介

又稱“樣本大小”,在一個樣本中所包含的個案或單元數。一般來說,樣本容量主要由精確度、同質性、財力、抽樣類型、分析類別等因素決定。在抽樣調查中,樣本容量的確定很重要。因為樣本容量太大,會造成人力、物力和財力的很大浪費;樣本容量太小,會使抽樣誤差太大,使調查結果與實際情況相差很大,影響調查的效果。
相關書籍相關書籍

解釋

樣本容量的大小涉及到調研中所要包括的單元數。樣本容量是對於你研究的總體而言的,是在抽樣調查中總體的一些抽樣。比如:中國人的身高值為一個總體,你隨機取一百個人的身高,這一百個人的身高數據就是總體的一個樣本。某一個樣本中的個體的數量就是樣本容量。注意:不能說樣本的數量就是樣本容量,因為總體中的若干個個體只組成一個樣本。樣本容量不需要帶單位。
在假設檢驗里樣本容量越大越好。但實際上不可能無窮大,就像研究中國人的身高不可能把所有中國人的身高全部測量一次一樣。

詳細內容

相關定義

回歸分析是從已經發生的經濟活動的樣本數據中尋找經濟活動中內含的規律性,它對樣本數據具有很強的依賴性。樣本的容量太小會導致參數估計值的大小和符號違反經濟理論和實際經驗。從建模需要來講,樣本容量越大越好,但收集與整理樣本數據是一件困難的工作,因此,選擇合適的樣本容量,既能滿足模型估計的需要,又能減輕收集數據的困難,是一個重要的實際問題。
(1) 最小樣本容量
所謂“最小樣本容量”,即從普通最小二乘法原理出發,欲得到參數估計量,不管其質量如何,所要求的樣本容量的下限,它是:n≥k+1
其中,k為解釋變數的數目。
(2) 滿足基本要求的樣本容量
一般經驗認為,當n≥30或者至少n≥3(k+1)時,才能滿足模型估計的基本要求。

最優選擇

在確定抽樣方法樣本量的時候,既要考慮調查的目的、調查性質和精度要求(抽樣誤差)等,又要考慮實際操作的可實施性,非抽樣誤差的控制、經費預算等。專業調查公司在這方面會根據您的情況及調查性質,進行綜合權衡,達到一個最優的樣本容量的選擇。

意義

合理確定樣本容量的意義:
1.樣本容量過大,會增加調查工作量,造成人力、物力、財力、時間的浪費;
2.樣本容量過小,則樣本對總體缺乏足夠的代表性,從而難以保證推算結果的精確度和可靠性;
3.樣本容量確定的科學合理,一方面,可以在既定的調查費用下,使抽樣誤差儘可能小,以保證推算的精確度和可靠性;另一方面,可以在既定的精確度和可靠性下,使調查費用儘可能少,保證抽樣推斷的最大效果。

樣本個數

所謂樣本個數,就是樣本可能的數目,指的是從一個總體中可能抽取的樣本數。例如一個容量為500的總體,從中抽取100個不同的子集做抽樣調查,則樣本個數為100。
統計統計

公式和方法

公式

具體確定樣本量還有相應的統計學公式,不同的抽樣方法對應不同的公式。根據樣本量計算公式,我們知道,樣本量的大小不取決於總體的多少,而取決於(1) 研究對象的變化程度;(2) 所要求或允許的誤差大小(即精度要求);(3) 要求推斷的置信程度。也就是說,當所研究的現象越複雜,差異越大時,樣本量要求越大;當要求的精度越高,可推斷性要求越高時,樣本量越大。因此,如果不同城市分別進行推斷時,大城市多抽,小城市少抽這種說法原則上是不對的。在大城市抽樣太大是浪費,在小城市抽樣太少沒有推斷價值。

計算方法

確定樣本容量的大小是比較複雜的問題,既要有定性的考慮也要有定量的考慮。從定性的方面考慮樣本量的大小,其考慮因素有:決策的重要性,調研的性質,變數個數,數據分析的性質,同類研究中所用的樣本量,發生率,完成率,資源限制等。具體地說,更重要的決策,需要更多的信息和更準確的信息,這就需要較大的樣本;探索性研究,樣本量一般較小,而結論性研究如描述性的調查,就需要較大的樣本;收集有關許多變數的數據,樣本量就要大一些,以減少抽樣誤差的累積效應;如果需要採用多元統計方法對數據進行複雜的高級分析,樣本量就應當較大;如果需要特別詳細的分析,如做許多分類等,也需要大樣本。針對子樣本分析比只限於對總樣本分析,所需樣本量要大得多。
公式:
(1)重複抽樣方式下:
變數總體重複抽樣計算公式:
屬性總體重複抽樣:
(2)不重複抽樣方式下:
變數總體不重複抽樣計算公式:
屬性總體不重複抽樣:

相關資料

在一些生產過程中,過程均值的正向飄移與負向飄移對生產者意味著不同損失。提出了兩種非對稱樣本容量均值圖,利用馬氏鏈方法研究了控制圖的控制性質。計算結果顯示,對於小於1.5個過程標準差的過程均值飄移,非對稱樣本容量均值圖在兼顧一方向飄移的同時能更加快速地發現另一方向飄移,而警戒限的加入加快了控制圖發現過程均值一個方向漂移的速度。

相關詞條

熱門詞條

聯絡我們