峰度

峰度

峰度(peakedness;kurtosis)又稱峰態係數。表征機率密度分布曲線在平均值峰值高低的特徵數。直觀看來,峰度反映了峰部的尖度。樣本的峰度是和常態分配相比較而言統計量,如果峰度大於三,峰的形狀比較尖,比常態分配峰要陡峭。反之亦然。

統計學中,峰度(Kurtosis)衡量實數隨機變數機率分布的峰態。峰度高就意味著方差增大是由低頻度的大於或小於平均值的極端差值引起的。

基本介紹

  • 中文名:峰度
  • 外文名:kurtosis
  • 別稱峰態係數
  • 含義峰度以bk表示,Xi是樣本測定值
  • 套用學科:統計學
  • 實質:衡量實數隨機變數機率分布的峰態
含義,四階標準矩,樣本峰度,套用,

含義

峰度以bk表示,Xi是樣本測定值,Xbar是樣本n次測定值的平均值,s為樣本標準差常態分配的峰度為3。以一般而言,常態分配為參照,峰度可以描述分布形態的陡緩程度,若bk<3,則稱分布具有不足的峰度,若bk>3,則稱分布具有過度的峰度。若知道分布有可能在峰度上偏離常態分配時,可用峰度來檢驗分布的正態性
根據均值不等式,可以確定出峰度(係數)的取值範圍:它的下限不會低於1,上限不會高於數據的個數。有一些典型分布的峰度(係數)值得特別關注。例如,常態分配的峰度(係數)為常數3,均勻分布的峰度(係數)為常數1.8。在統計實踐中,我們經常把這兩個典型的分布曲線作為評價樣本數據序列分布性態的參照。設若先將數據標準化,則峰度(係數)相當於標準化數據序列的四階中心矩。所以,在相同的標準差下,峰度係數越大,分布就有更多的極端值,那么其餘值必然要更加集中在眾數周圍,其分布必然就更加陡峭。
峰度

四階標準矩

可以定義為:
其中μ4是四階中心矩,σ是標準差
在更通常的情況下,峰度被定義為四階累積量除以二階累積量的平方,它等於四階中心矩除以機率分布方差的平方再減去3:
這也被稱為超值峰度(excess kurtosis)。“減3”是為了讓常態分配的峰度為0。
假定Yn個獨立變數之和,且這些變數和X具有相同的分布,那么:Kurt[Y]=Kurt[X]/n, 但如果峰度被定義為:μ4/σ,公式可變得更加複雜。
更一般地說,假定X1, ...,Xn為方差相等的獨立隨機變數,那么:
而定義中如果不包含“減3”就無法成立。
如果超值峰度為正,稱為尖峰態(leptokurtic)。如果超值峰度為負,稱為低峰態(platykurtic)。

樣本峰度

對於具有n個值的樣本樣本峰度為:
其中m4是四階樣本中心矩,m2是二階中心矩(即使樣本方差),xi是第i個值,
是樣本平均值。注意此處計算方差的時候除數是N,而不是單獨計算樣本方差的(N-1)。
有時候也使用公式:
其中,n為樣本大小,D為事先計算的方差,xi為第i個測量值,
為事先計算的算術平均數
在一些統計軟體中,其公式有所差別。如EXCEL,計算樣本的峰度公式如下:

套用

在實際套用中,通常將峰度值做減3處理,使得常態分配的峰度0。因此,在使用統計軟體進行計算時,應注意該軟體默認的峰度值計算公式。如Eviews默認的常態分配峰度為3。

相關詞條

熱門詞條

聯絡我們