異常值

異常值

異常值(outlier)是指一組測定值中與平均值的偏差超過兩倍標準差的測定值,與平均值的偏差超過三倍標準差的測定值,稱為高度異常的異常值。

基本介紹

  • 中文名:異常值
  • 外文名:outlier
  • 套用:統計
  • 高度異常:與平均值的偏差超過三倍標準差
定義,判斷處理,1、依據標準,2、異常值定義,3、異常值的種類,4、判斷異常值的統計學原則,5、判斷異常值的規則:,6、格拉布斯(Grubbs)檢驗法,在回彈法檢測砼強度中的套用,

定義

異常值outlier:一組測定值中與平均值的偏差超過兩倍標準差的測定值。與平均值的偏差超過三倍標準差的測定值,稱為高度異常的異常值。在處理數據時,應剔除高度異常的異常值。異常值是否剔除,視具體情況而定。在統計檢驗時,指定為檢出異常值的顯著性水平α=0.05,稱為檢出水平;指定為檢出高度異常的異常值的顯著性水平α=0.01,稱為捨棄水平,又稱剔除水平(reject level)。

判斷處理

1、依據標準

計數抽樣檢驗程式》(GB2828)、《正態樣本異常值的判斷和處理》(GB4883)。

2、異常值定義

異常值是指樣本中的個別值,其數值明顯偏離它(或他們)所屬樣本的其餘觀測值。

3、異常值的種類

(1)可能是總體固有的隨機變異性的極端現,屬同一總體;
(2)可能是試驗條件和方法的偶然偏離,不屬同一總體。

4、判斷異常值的統計學原則

(1)上側情形:異常值為高端值;
(2)下側情形:異常值為低端值;
(3)雙側情形:異常值在兩端可能出現極端值。

5、判斷異常值的規則:

(1)標準差已知——奈爾(Nair)檢驗法;
(2)標準差未知——格拉布斯(Grubbs)檢驗法和狄克遜(Dixon)檢驗法。

6、格拉布斯(Grubbs)檢驗法

(1)計算統計量
μ=(X1+X2+…+Xn)/n
s=(∑(Xi-μ)/(n-1))½(i=1,2…n)
Gn=(X(n)-μ)/s
式中μ——樣本平均值
s——樣本標準差
Gn——格拉布斯檢驗統計量。
(2)確定檢出水平α,查表(見GB4883)得出對應n,α的格拉布斯檢驗臨界值G1-α(n)。
(3)當Gn>G1-α(n),則判斷Xn為異常值,否則無異常值。
(4)給出剔除水平α’的G1-α’(n),噹噹Gn>G1-α’(n)時,Xn為高度異常值,應剔除。

在回彈法檢測砼強度中的套用

將測區混凝土強度換算值按從小到大的順序排列f1、f2、…fn,計算格拉布斯檢驗統計量:
Gn=(fn-m)/s
Gn’=(m-f1)/s
式中m——測區混凝土強度換算值的平均值
s——測區混凝土強度標準差
取檢出水平α為5%,剔除水平α’為1%,按雙側情形檢驗,從附表中查得檢出水平α對應格拉布斯檢驗臨界值G0.975,剔除水平α’對應格拉布斯檢驗臨界值G0.995。
若Gn>Gn’,且Gn>G0.975,則判斷fn為異常值,否則,判斷無異常值;
若Gn>Gn’,且Gn>G0.995,則判斷fn為高度異常值,可考慮剔除;
若Gn’>Gn,且Gn’>G0.975,則判斷f1為異常值,否則,判斷無異常值;
若Gn’>Gn,且Gn’>G0.995,則判斷f1為高度異常值,可考慮剔除;
分析異常值出現原因,判斷異常值是否捨棄。不得隨意捨去異常值,應檢查異常值出現是否系材料或施工質量變化等原因所致。若檢出了一個異常值,對除去已檢出異常值後餘下得數值繼續用格拉布斯檢驗法檢驗,直到不能檢出異常值為止。

相關詞條

熱門詞條

聯絡我們