定義
預報評分(skill-scores of forecast)是指預報準確性的定量檢驗方法。預報評分方法是
氣象學、
數理統計和
資訊理論綜合研究的一個課題。
目的和原則
目的
預報評分的目的在於恰當地評價預報質量,進行不問預報方法的比較,以最終改進預報方法。
原則
① 評分標準要客觀;
② 評分結果真實反映預報水平;
③ 評分要有可比性;
④要避免預報員為獲取高分而產生錯誤的預報傾向。
評分標準
評價標準(方法)很多,從性質上可分為兩種,一種是絕對度量,另一種是相對度量。
絕對度量
絕對度量是樣本中預報值和
觀測值的函式,度量預報值與觀測值之間的差異。它僅考查預報本身的準確性,並未考慮技術上的優劣,所以,這種度量不具有可比性。
常用的評分標準有預報要素場和實況要素場之間的
相關係數(或其
距平的相關係數)、要素場預報的
平均絕對誤差、
相對誤差、
均方誤差或最大誤差。此外,還有量度水平氣壓梯度歸一化預報誤差的S1評分法,基於
熵的概念的信息比方法等。
相對度量
相對度量則是樣本數量以及與
參考系統相聯繫的預報和觀測的函式,是一個樣本的預報質量相對於參考系統得出的預報質量的度量,從而可以顯示預報技巧,這種度量一般叫
技巧評分,而參考預報,一般是
隨機預報、
氣候預報或是持續預報。
研究歷史
1884年,美國陸軍信號兵Finley軍士對美國中東部的
龍捲風預報,用他本人提出的“準確率”評分方法進行了檢驗評估,並發表了論文,由此引發了1884 - 1893年間人們對預報評價工作的關注,推動了預報評價概念的建立及方法的研究, Finley的預報試驗也成為許多教科書和文章中闡述預報評分時常引用的典型案例。
在Finley的論文發表後6個月內,有3個人發表文章指出了Finley評分方法的不足,並提出了自己的評分方法:第一位是Gilbert,僅僅在兩個月後就發表了論文,提出了一種評分方法,後被Palmer等重新發現並命名為風險評分TS(threatscore),再被Donaldson發現並命名為臨界成功指數CSI(critical success index),Gilbert同時還提出了修正的CSI評分,即Gilbert技巧評分GSS(Gilbert skill score),Schaefer,Black後來也分別發現了這一技巧評分,後者稱其為公平風險評分ETS(equitable threat score);第二位是Price,他提出了一種技巧評分方法,Hanssen等提出了與之近似的所謂HK判別式(Hanssen-Kuipers discriminant)或稱Kuipers成績指數(Kuipers' s performance index),Flueck在1987年提出了與Peirce技巧評分相同的所謂真實技巧統計量TSS(true skill statistic);第三位是Doolittle,先後提出了兩種技巧評分,後一種就是現在使用的Heidke技巧評分HSS(Heidke skill score)。
1884— 1893年提出的這些評分方法至今仍然使用著,百餘年來不斷有人重新發現並命名,但關於
預報檢驗的概念和方法並沒有什麼改變。