概述
當母群的性質不清楚時,我們須利用某一量數作為估計數,以幫助了解母數的性質。如:樣本平均數乃是母群平均數μ的估計數。當我們只用一個特定的值,亦即數線上的一個點,作為估計值以估計母數時,就叫做點估計。
點估計目的是依據
樣本X=(X
1、X
2…X
i)估計總體分布所含的未知參數θ或θ的函式g(θ)。一般θ或g(θ)是
總體的某個特徵值,如
數學期望、
方差、
相關係數等。
構造方法
點估計的方法,旨在用
樣本矩的函式估計
總體矩的同一函式。
例如,若
總體分布服從常態分配:
,其中μ是總體均值,
是總體
方差,未知參數可記為θ=(μ,σ)。σ/μ(μ≠0)稱為變異係數,它是總體的一階原點矩(即均值)μ與二階中心矩(即方差)
的函式。設有樣本X=(X
1、X
2…X
i),其一階樣本原點矩為,二階樣本中心矩為,而用估計 σ/μ,就是一個典型的矩估計方法。
估計法
(1)最大似然估計法
此法作為一種重要而普遍的點估計法,由英國統計學家R.A.費希爾在1912年提出。後來在他1921年和1925年的工作中又加以發展。設樣本X=(X
1,X
2,…,X
n)的分布密度為L(X,θ),若固定X而將L視為θ的函式,則稱為似然函式,當X是簡單隨機樣本時,它等於ƒ(X
1,θ)ƒ(X
2,θ)…ƒ(X
n,θ),其中,ƒ(X,θ)是
總體分布的密度函式或機率函式(見機率分布)。一經得到
樣本值x,就確定x,然後使用估計g(θ),這就是g(θ)的最大似然估計。例如,不難證明,前面為估計常態分配
中的參數μ和
而提出的估計量和2,就是μ和
的最大似然估計。
(2)最小二乘估計法
這個重要的估計方法是由德國數學家C.F.高斯在1799~1809年和法國數學家A.-M.勒讓德在1806年提出,並由俄國數學家Α.Α.馬爾可夫在1900年加以發展。它主要用於線性統計模型中的參數估計問題。貝葉斯估計法是基於“貝葉斯學派”的觀點而提出的估計法(見貝葉斯統計)。
參數估計
參數估計的一種形式。目的是依據
樣本X=(X
1、X
2…X
n)估計
總體分布所含的未知參數
θ或
θ的函式
g(
θ)。一般
θ或
g(
θ)是總體的某個特徵值,如
數學期望、
方差、
相關係數(見
相關分析)等。
θ或
g(
θ)通常取實數或
k維實向量為值。點估計問題就是要構造一個只依賴於
樣本X的量抭(
X),作為
g(
θ)的
估計值。抭(
X)稱為
g(
θ)的估計量。因為
k維實
向量可表為
k維
歐幾里得空間的一個點,故稱這樣的估計為點估計。
例如,設一批產品的廢品率為
θ,為估計
θ,從這批產品中隨機地抽出
n個作檢查,以
X記其中的廢品個數,用
X/
n估計
θ,就是一個點估計。又如用
樣本方差(見
統計量)估計
總體分布的方差,或用樣本
相關係數估計總體分布的相關係數,都是常見的點估計。
優良準測
小樣本優良性準則
可以用來估計g(θ)的估計量很多,於是產生了怎樣選擇一個優良估計量的問題。首先必須對“優良性”定出準則。這種準則不是惟一的,它可以根據問題的實際背景和理論上的方便進行選擇。
優良性準則有兩大類:一類是小
樣本準則,即在樣本大小固定時的優良性準則;另一類是大樣本準則,即在樣本大小趨於無窮時的優良性準則。最重要的小樣本優良性準則是無偏性及與此相關的一致最小
方差無偏計。
若一個估計量抭(X)的
數學期望等於被估計的g(θ),即對一切θ,則稱抭(X)為g(θ)的無偏估計,這種估計的特點是:在多次重複用時,抭(X)與g(θ)的偏差的算術平均值隨使用次數的增加而趨於零。因此,無偏性只在重複使用中,並且各次誤差能相互抵消時,才顯出其意義。
無偏估計並不總是存在。例如,設
總體服從二項分布B(n,θ),0<;θ<1,則1/θ的無偏估計就不存在。有時,無偏估計雖然存在,但很不合理。在一些問題中,無偏估計有很多,它們的優良性由其
方差來衡量,方差愈小愈好。若一無偏估計的方差比任何別的無偏估計的方差都小,或至多相等,則稱它為一致最小方差無偏估計。尋找一致最小方差無偏估計的一個普遍方法,是D.布萊克
韋爾、E.L.萊曼和H.謝菲在1950年提出的,它基於
統計量的充分性與完全性的概念:設抭(X)是一個無偏估計,T是一個完全充分統計量,則抭(X)在給定T時的條件期望就是一個一致最小方差無偏估計。克拉默-拉奧不等式是尋求一致最小方差無偏估計的另一重要工具,是由印度統計學家C.R.拉奧和
瑞典統計學家H.克拉默在1945年和1946年先後獨立地證明的。當
樣本的似然函式L(X,θ)滿足一定條件時,則 g(θ)的任一無偏估計 抭(X)的
方差,對於一切θ滿足不等式這個不等式的右邊只與樣本的分布及待估函式 g有關,而與抭(X)無關。通常稱這個不等式為克拉默-拉奧不等式,或C-R不等式。它的右邊給出了 g(θ)的無偏估計的方差的最小下界,稱為克拉默-拉奧下界或C-R下界。因此,若某一無偏估計的方差達到上述C-R下界,則它必是一致最小方差無偏估計。C-R不等式在其他統計問題中也有套用。
在點估計問題中還使用其他一些小
樣本準則,如容許性準則、最小化最大準則、最優同變準則(見統計決策理論)等。
大樣本優良性準則
(1)相合性
若g(θ)的估計量 抭n(X
1、X
2…X
n)在n趨於無窮時,在某種收斂意義下(見機率論中的收斂)收斂於g(θ),則稱抭n(X1,…,Xn)是 g(θ)的在這種收斂意義下的相合估計。這是點估計最基本的大
樣本準則。例如依機率收斂意義下的相合性稱為弱相合,幾乎必然收斂意義下的相合性稱為強相合。矩估計一般具有相合性。最大似然估計在一定條件下為強相合的證明始自A.瓦爾德1949年的工作,並在以後為許多學者所發展。線性統計模型中參數的最小二乘估計的強相合性研究始於20世紀60年代,-取得很大的進展。
(2)最優漸近正態估計
簡稱BAN估計。設X
1、X
2…X
n為從一
總體中隨機獨立地抽出的
樣本,
總體分布具有密度函式或機率函式 ƒ(x,θ),滿足一定的正則條件,設g(θ)為待估函式,記 式中稱為費希爾信息量,若g(θ)的估計量為抭n(X
1、X
2…X
n),當n→時,依分布收斂於常態分配 N(0,v2(θ)),就稱此估計量為g(θ)的 BAN估計。在g(θ)的一類漸近正態估計中,以這種估計的漸近
方差最小,故稱為最優漸近正態估計。在一般條件下,最大似然估計是BAN估計。
(3)漸近有效估計
當
樣本大小為n時,C-R不等式的右邊(即C-R下界)就是 v2(θ)/n。在BAN估計定義中,並未要求估計量抭n(X
1、X
2…X
n)的方差存在,如果去掉漸近正態性的要求,而要求抭n(X
1、X
2…X
n)的方差存在且漸近於C-R下界,則得到克拉默於1946年定義的漸近有效估計的概念。不少情況下,BAN估計也是漸近有效估計。1960年印度統計學家R.R.巴哈
杜爾提出另一種漸近有效性的概念,還可以用於假設檢驗問題。--日本統計學家竹內啟又在兩個方面發展了估計的漸近有效性概念:一是漸近分布不必是常態分配;二是收斂於漸近分布的階不必是。
點估計理論是數理統計學得到較多和較深入發展的一個方面。在小
樣本方面,1955年C.施坦提出了一個反例,證明當維數大於2時,多維常態分配均值向量的通常估計(樣本均值)在平方損失下不可容許。這個簡單的但出乎意料的反例啟發了關於點估計的容許性的一系列研究。在大
樣本方面,值得提到的發展還有自適應估計、穩健估計及非
參數估計方面許多深入的結果。