估計量

估計量

統計學中,估計量是基於觀測數據計算一個已知量的估計值的法則:於是估計量(estimator)、被估量(estimand)和估計值(estimate)是有區別的。

估計量用來估計未知總體的參數,它有時也被稱為估計子;一次估計是指把這個函式套用在一組已知的數據集上,求函式的結果。對於給定的參數,可以有許多不同的估計量。我們通過一些選擇標準從它們中選出較好的估計量,但是有時候很難說選擇這一個估計量比另外一個好。

基本介紹

定義,量化特性,誤差,均方誤差,一致性,

定義

用來估計總體未知參數用的統計量
當經測定的具體數值代入估計量時,它就是一個具體的數值,稱為估計值,英文是estimator。
設(X1,……,Xn)為來自總體X的樣本,(X1,……,Xn)為相應的樣本值,θ是總體分布的未知參數,θ∈Θ。
Θ表示θ的取值範圍,稱Θ為參數空間.儘管θ是未知的,但它的參數空間Θ是事先知道的.為了估計未知參數θ,我們構造一個統計量h(X1,……,Xn),然後用h(X1,……,Xn)的值h(X1,……,Xn)來估計θ的真值,稱h(X1,……,Xn)為θ的估計量。
假設存在一個固定的待估參數。那么"估計量"是樣本空間映射到樣本估計值的一個函式。
的一個估計量記為
。很容易用隨機變數的代數來闡述這個理論:因而如果用X來標記對應觀測數據的隨機變數,估計量(本身視為隨機變數)的符號表示為該隨機變數的函式,
。對特定觀測數據集(即對於X=x)的估計值為一固定值
。通常使用簡化標記,用
表示隨機變數,不過這會造成誤解。

量化特性

以下定義和屬性是相關的。

誤差

對於一個給定樣本x,估計量
的"誤差"定義為
其中
是待估參數。注意誤差e不僅取決於估計量(估計公式或過程),還取決於樣本。

均方誤差

估計量
的均方誤差被定義為誤差的平方的期望值,即為:
它用來顯示估計值的集合與被估計單個參數的平均差異。試想下面的類比:假設“參數”是靶子的靶心,“估計量”是向靶子射箭的過程,而每一支箭則是“估計值”(樣本)。那么,高均方誤差就意味著每一支箭離靶心的平均距離較大,低均方誤差則意味著每一支箭離靶心的平均距離較小。箭支可能集聚,也可能不。比如說,即使所有箭支都射中了同一個點,同時卻嚴重偏離了靶子,均方誤差相對來說依然很大。然而要注意的是,如果均方誤差相對較小,箭支則更有可能集聚(而不是離散)。

一致性

一致估計量序列是一列隨著序號(通常是樣本容量)無限增大時依機率收斂於被估量的估計量序列。換句話說,增加樣本容量增大了估計量接近總體參數的機率。
在數學上,一個估計量序列{tn;n≥ 0}是參數θ的一致估計量若且唯若對於所有ϵ> 0,不管多小,我們都有
就如,一個人不斷地拋硬幣,隨著次數的增多,任何一面出現的機率(機率)就會趨於0.5。那么這個0.5就是這個拋硬幣事件中任何一面出現機率的一致估計量,或者說一致估計值。

相關詞條

熱門詞條

聯絡我們