樣本分布函式

定義

樣本分布函式

我們知道，若總體是隨機變數X，則X的分布就是總體的分布(也叫理論分布)，X的分布函式便是總體的分布函式。要了解總體的情況，就要了解隨機變數x的分布或它的某些數字特徵。樣本是總體的代表和反映，簡單隨機樣本應該能很好地反映總體的情況。那末，如何由樣本來推斷總體的分布呢?一般做法是作出樣本分布函式用以觀察理論分布的概貌。為此我們給出樣本分布函式的定義。

設(X₁，X₂，…，X_n)是來自總體X的一個簡單隨機樣本，將其一個觀測值(x₁，x₂，…x_n，)的分量按從小到大的順序排列成

其中

出現的頻數為

，記

稱F(X)為總體X的樣本分布函式或經驗分布函式。

圖象意義

樣本分布函式的圖像也是類似於離散型隨機變數分布函式的圖像，是一條跳躍式上升的階梯形曲線，在每個間斷點x_(k)處跳躍。若樣本觀測值的各分量x₁，x₂，…，x_n不重複，則每一躍度為

；若某一分量重複m次，則在該分量處躍度為

。

性質

由此定義容易看出，F_n(x)滿足下列性質：

(1)(單調有界性)樣本分布函式是單調增加的有界函式，且0≤F_n(x)≤1；

(2)(規範性)

，

；

(3)(右連續性)對於任意的實數a，

；

(4)F_n(x)為非減函式；

由此可見，樣本分布函式F_n(x)具有分布函式的性質，我們可以將其看成是以等機率

取值X₁，X₂，…，X_n的離散型隨機變數的分布函式。

此外，對於任何實數x，F_n^*(x)的值等於樣本的n個觀測值中不超過x的個數除以樣本容量n。它正是n次獨立觀測中，事件{X≤x}出現的頻率。由機率與頻率的關係可知，當n充分大時，F_n^*(x)可以作為未知分布函式F(x)的一個近似。因此樣本分布函式F_n^*(x)可以作為總體分布函式的近似，n越大，近似程度越好.這正是我們用樣本觀測值來估計和推斷總體的一個重要依據。