評價標(biāo)準(zhǔn)(方法)很多,從性質(zhì)上可分為兩種,一種是絕對度量,另一種是相對度量。

定義

預(yù)報評分(skill-scores of forecast)是指預(yù)報準(zhǔn)確性的定量檢驗方法。預(yù)報評分方法是氣象學(xué)、數(shù)理統(tǒng)計和信息論綜合研究的一個課題。

目的和原則

目的

預(yù)報評分的目的在于恰當(dāng)?shù)卦u價預(yù)報質(zhì)量,進行不問預(yù)報方法的比較,以最終改進預(yù)報方法。

原則

① 評分標(biāo)準(zhǔn)要客觀;

② 評分結(jié)果真實反映預(yù)報水平;

③ 評分要有可比性;

④要避免預(yù)報員為獲取高分而產(chǎn)生錯誤的預(yù)報傾向。

評分標(biāo)準(zhǔn)

評價標(biāo)準(zhǔn)(方法)很多,從性質(zhì)上可分為兩種,一種是絕對度量,另一種是相對度量。

絕對度量

絕對度量是樣本中預(yù)報值和觀測值的函數(shù),度量預(yù)報值與觀測值之間的差異。它僅考查預(yù)報本身的準(zhǔn)確性,并未考慮技術(shù)上的優(yōu)劣,所以,這種度量不具有可比性。

常用的評分標(biāo)準(zhǔn)有預(yù)報要素場和實況要素場之間的相關(guān)系數(shù)(或其距平的相關(guān)系數(shù))、要素場預(yù)報的平均絕對誤差、相對誤差、均方誤差或最大誤差。此外,還有量度水平氣壓梯度歸一化預(yù)報誤差的S1評分法,基于熵的概念的信息比方法等。

相對度量

相對度量則是樣本數(shù)量以及與參考系統(tǒng)相聯(lián)系的預(yù)報和觀測的函數(shù),是一個樣本的預(yù)報質(zhì)量相對于參考系統(tǒng)得出的預(yù)報質(zhì)量的度量,從而可以顯示預(yù)報技巧,這種度量一般叫技巧評分,而參考預(yù)報,一般是隨機預(yù)報、氣候預(yù)報或是持續(xù)預(yù)報。

研究歷史

1884年,美國陸軍信號兵Finley軍士對美國中東部的龍卷風(fēng)預(yù)報,用他本人提出的“準(zhǔn)確率”評分方法進行了檢驗評估,并發(fā)表了論文,由此引發(fā)了1884 - 1893年間人們對預(yù)報評價工作的關(guān)注,推動了預(yù)報評價概念的建立及方法的研究, Finley的預(yù)報試驗也成為許多教科書和文章中闡述預(yù)報評分時常引用的典型案例。

在Finley的論文發(fā)表后6個月內(nèi),有3個人發(fā)表文章指出了Finley評分方法的不足,并提出了自己的評分方法:第一位是Gilbert,僅僅在兩個月后就發(fā)表了論文,提出了一種評分方法,后被Palmer等重新發(fā)現(xiàn)并命名為風(fēng)險評分TS(threatscore),再被Donaldson發(fā)現(xiàn)并命名為臨界成功指數(shù)CSI(critical success index),Gilbert同時還提出了修正的CSI評分,即Gilbert技巧評分GSS(Gilbert skill score),Schaefer,Black后來也分別發(fā)現(xiàn)了這一技巧評分,后者稱其為公平風(fēng)險評分ETS(equitable threat score);第二位是Price,他提出了一種技巧評分方法,Hanssen等提出了與之近似的所謂HK判別式(Hanssen-Kuipers discriminant)或稱Kuipers成績指數(shù)(Kuipers' s performance index),F(xiàn)lueck在1987年提出了與Peirce技巧評分相同的所謂真實技巧統(tǒng)計量TSS(true skill statistic);第三位是Doolittle,先后提出了兩種技巧評分,后一種就是現(xiàn)在使用的Heidke技巧評分HSS(Heidke skill score)。

1884— 1893年提出的這些評分方法至今仍然使用著,百余年來不斷有人重新發(fā)現(xiàn)并命名,但關(guān)于預(yù)報檢驗的概念和方法并沒有什么改變。