基本介紹
- 中文名:U統計量
- 外文名:U-statistic
- 屬性:一種重要的統計量
- 提出者:霍夫丁(W.Hoeffding)
- 提出時間:1948年
基本介紹,相關性質,統計量,
基本介紹
估計問題有的是對特殊分布族的某個參數函式的估計,例如Bernoulli分布的機率p的估計問題,也有一些是對廣泛的分布族中分布F的某個特徵的估計問題,例如分布F的均值、方差或分布函式在某一點的函式值的估計問題。對於分布的特徵均值 或分布函式在的函式值也可寫成如下的形式:
在上述的表示中,如果將分布本身看作為一個“參數”,那么要估計的分布的特徵也是“參數”的函式。所以一般的可以考慮下列形式的特徵的估計問題:
這裡的分布族可以是較為廣泛的分布族,例如。
式(1)中的h也稱為參數函式g的核(kernel),k稱為核的階(order)。
對於以為核的參數函式, 一個基於樣本的簡單的無偏估計是,但它只使用了樣本的前幾個觀測,為了利用所有的觀測,一個自然的做法是對稱化。
定義 基於樣本的統計量
稱為U-統計量(U statistics),h也稱為統計量的核。(2)中的表示對中取k個元素的排列求和。
相關性質
(1)以h為核的U-統計量是h對應的參數函式的無偏估計。
(2)由於對的任一個排列成立
所以不妨只考慮關於其變數為對稱的核h,即h滿足條件
對的任一個排列成立。
(3)對於對稱的k階核h,其U-統計量可寫為
(4)U-統計量關於的任一排列是不變的,所以它是只依賴於樣本順序統計量的函式。
統計量
統計量(statistic)是指樣本的已知函式,其作用是把樣本中有關總體的信息匯集起來,是數理統計學中一個重要的基本概念。常用統計量有樣本矩、次序統計量、U統計量和秩統計量等。其中U統計量是W.霍夫丁於1948年引進的。統計量的充分性和完全性是兩個重要概念,充分性是費希爾在1925年引進的,內曼和P.R.哈爾莫斯在1949年嚴格證明了一個判定統計量充分性的方法,叫做因子分解定理。統計量的分布叫做抽樣分布,它的研究是數理統計中的重要課題。對一維正態總體,有三個重要的抽樣分布,即分布、分布和分布。其中分布是F.赫爾梅特於1875年在研究正態總體的樣本方差時得到的;分布是英國統計學家W.S.戈塞特(筆名“學生”)於1908年提出的;分布是費希爾在20世紀20年代提出的。