評價標準(方法)很多,從性質(zhì)上可分為兩種,一種是絕對度量,另一種是相對度量。

定義

預報評分(skill-scores of forecast)是指預報準確性的定量檢驗方法。預報評分方法是氣象學、數(shù)理統(tǒng)計和信息論綜合研究的一個課題。

目的和原則

目的

預報評分的目的在于恰當?shù)卦u價預報質(zhì)量,進行不問預報方法的比較,以最終改進預報方法。

原則

① 評分標準要客觀;

② 評分結果真實反映預報水平;

③ 評分要有可比性;

④要避免預報員為獲取高分而產(chǎn)生錯誤的預報傾向。

評分標準

評價標準(方法)很多,從性質(zhì)上可分為兩種,一種是絕對度量,另一種是相對度量。

絕對度量

絕對度量是樣本中預報值和觀測值的函數(shù),度量預報值與觀測值之間的差異。它僅考查預報本身的準確性,并未考慮技術上的優(yōu)劣,所以,這種度量不具有可比性。

常用的評分標準有預報要素場和實況要素場之間的相關系數(shù)(或其距平的相關系數(shù))、要素場預報的平均絕對誤差、相對誤差、均方誤差或最大誤差。此外,還有量度水平氣壓梯度歸一化預報誤差的S1評分法,基于熵的概念的信息比方法等。

相對度量

相對度量則是樣本數(shù)量以及與參考系統(tǒng)相聯(lián)系的預報和觀測的函數(shù),是一個樣本的預報質(zhì)量相對于參考系統(tǒng)得出的預報質(zhì)量的度量,從而可以顯示預報技巧,這種度量一般叫技巧評分,而參考預報,一般是隨機預報、氣候預報或是持續(xù)預報。

研究歷史

1884年,美國陸軍信號兵Finley軍士對美國中東部的龍卷風預報,用他本人提出的“準確率”評分方法進行了檢驗評估,并發(fā)表了論文,由此引發(fā)了1884 - 1893年間人們對預報評價工作的關注,推動了預報評價概念的建立及方法的研究, Finley的預報試驗也成為許多教科書和文章中闡述預報評分時常引用的典型案例。

在Finley的論文發(fā)表后6個月內(nèi),有3個人發(fā)表文章指出了Finley評分方法的不足,并提出了自己的評分方法:第一位是Gilbert,僅僅在兩個月后就發(fā)表了論文,提出了一種評分方法,后被Palmer等重新發(fā)現(xiàn)并命名為風險評分TS(threatscore),再被Donaldson發(fā)現(xiàn)并命名為臨界成功指數(shù)CSI(critical success index),Gilbert同時還提出了修正的CSI評分,即Gilbert技巧評分GSS(Gilbert skill score),Schaefer,Black后來也分別發(fā)現(xiàn)了這一技巧評分,后者稱其為公平風險評分ETS(equitable threat score);第二位是Price,他提出了一種技巧評分方法,Hanssen等提出了與之近似的所謂HK判別式(Hanssen-Kuipers discriminant)或稱Kuipers成績指數(shù)(Kuipers' s performance index),F(xiàn)lueck在1987年提出了與Peirce技巧評分相同的所謂真實技巧統(tǒng)計量TSS(true skill statistic);第三位是Doolittle,先后提出了兩種技巧評分,后一種就是現(xiàn)在使用的Heidke技巧評分HSS(Heidke skill score)。

1884— 1893年提出的這些評分方法至今仍然使用著,百余年來不斷有人重新發(fā)現(xiàn)并命名,但關于預報檢驗的概念和方法并沒有什么改變。