有偏估計

有偏估計(biased estimate)是指由樣本值求得的估計值與待估參數的真值之間有系統誤差,其期望值不是待估參數的真值。在統計學中,估計量偏差(或偏差函式)是此估計量的期望值與估計參數的真值之差。偏差為零的估計量或決策規則稱為無偏的。否則該估計量是有偏的。在統計學中,“偏差”是一個函式的客觀陳述。

基本介紹

  • 中文名:有偏估計
  • 外文名:biased estimate
  • 學科:統計學
  • 相關術語:無偏估計,偏差
簡介,定義,樣本方差,

簡介

偏差是相對於中位數來衡量,而非相對於均值(期望值),在這種情況下為了與通常的均值無偏性區別,稱作中值無偏。偏差與一致性相關聯,一致估計量都是收斂並且漸進無偏的(因此會收斂到正確的值),雖然一致序列中的個別估計量可能是有偏的(只要偏差收斂於零)。
當其他量相等時,無偏估計量比有偏估計量更好一些,但在實踐中,並不是所有其他統計量的都相等,於是也經常使用有偏估計量,一般偏差較小。當使用一個有偏估計量時,也會估計它的偏差。有偏估計量可能用於以下原因:由於如果不對總體進一步假設,無偏估計量不存在或很難計算(如標準差無偏估計);由於估計量是中值無偏的,卻不是均值無偏的(或反之);由於一個有偏估計量較之無偏估計量(特別是收縮估計量)可以減小一些損失函式(尤其是均方差);或者由於在某些情況下,無偏的條件太強,而這些無偏估計量沒有太大用處。此外,在非線性變換下均值無偏性不會保留,不過中值無偏性會保留;例如樣本方差是總體方差的無偏估計量,但它的平方根標準差則是總體標準差的有偏估計量。

定義

設我們有一個參數為實數
機率模型,產生觀測數據的機率分布
,而統計量
是基於任何觀測數據
估計量。也就是說,我們假定我們的數據符合某種未知分布
(其中
是一個固定常數,而且是該分布的一部分,但具體值未知),於是我們構造估計量
,該估計量將觀測數據與我們希望的接近
的值對應起來。因此這個估量的(相對於參數
的)偏差定義為
其中
表示分布
期望值,即對所有可能的觀測值
取平均。由於θ對於條件分布
是可測的,就有了第二個等號。
對於參數θ的所有值的偏差都等於零的估計量稱為無偏估計
在一次關於估計量性質的模擬實驗中,有偏估計可以用平均有符號離差來評估。

樣本方差

隨機變數的樣本方差從兩方面說明了估計量偏差:首先,自然估計量(naive estimator)是有偏的,可以通過比例因子校正;其次,無偏估計量均方差(MSE)不是最優的,可以用一個不同的比例因子來最小化,得到一個比無偏估計量的MSE更小的有偏估計量。
具體地說,自然估計量就是將離差平方和加起來然後除以
,是有偏的。不過除以
會得到一個無偏估計量。相反,MSE可以通過除以另一個數來最小化(取決於分布),但這會得到一個有偏估計量。這個數總會比
大,所以這就叫做收縮估計量,因為它把無偏估計量向零“收縮”;對於常態分配,最佳值為
期望
方差
獨立同分布隨機變數。如果樣本均值與未修正樣本方差定義為
的一個有偏估計量,因為
換句話說,未修正的樣本方差的期望值不等於總體方差
,除非乘以歸一化因子。而樣本均值是總體均值
的無偏估計量。
是有偏的原因源於樣本均值是
的普通最小二乘(OLS)估計量這個事實:
是令
儘可能小的數。也就是說,當任何其他數代入這個求和中時,這個和只會增加。尤其是,在選取
就會得出,
於是,
注意到,通常的樣本方差定義為
而這時總體方差的無偏估計量。可以由下式看出:
有偏(未修正)與無偏估計之比稱為貝塞爾修正。

相關詞條

熱門詞條

聯絡我們