OpenCV中庫函數(shù)的作用:歸一化。

中文名

歸一化

拼音

guī yī huà

基本介紹

定義與作用

歸一化就是要把需要處理的數(shù)據(jù)經(jīng)過處理后(通過某種算法)限制在你需要的一定范圍內(nèi)。首先歸一化是為了后面數(shù)據(jù)處理的方便,其次是保證程序運行時收斂加快。歸一化的具體作用是歸納統(tǒng)一樣本的統(tǒng)計分布性。歸一化在0-1之間是統(tǒng)計的概率分布,歸一化在某個區(qū)間上是統(tǒng)計的坐標分布。歸一化有同一、統(tǒng)一和合一的意思。

目的

簡而言之,是使得沒有可比性的數(shù)據(jù)變得具有可比性,同時又保持相比較的兩個數(shù)據(jù)之間的相對關(guān)系,如大小關(guān)系;或是為了作圖,原來很難在一張圖上作出來,歸一化后就可以很方便地給出圖上的相對位置等。

在使用機器學習算法的數(shù)據(jù)預處理階段,歸一化也是非常重要的一個步驟。例如在應(yīng)用SVM之前,縮放是非常重要的。Sarle的神經(jīng)網(wǎng)絡(luò)FAQ的第二部分(1997)闡述了縮放的重要性,大多數(shù)注意事項也適用于SVM。縮放的最主要優(yōu)點是能夠避免大數(shù)值區(qū)間的屬性過分支配了小數(shù)值區(qū)間的屬性。另一個優(yōu)點是能避免計算過程中的數(shù)值復雜度。因為關(guān)鍵值通常依賴特征向量的內(nèi)積(inner products),例如,線性核和多項式核,屬性的大數(shù)值可能會導致數(shù)值問題。推薦將每個屬性線性縮放到區(qū)間[-1,+1]或者[0, 1]。

當然,必須使用同樣的方法縮放訓練數(shù)據(jù)和測試數(shù)據(jù)。例如,假設(shè)把訓練數(shù)據(jù)的第一個屬性從[-10,+10]縮放到[-1, +1],那么如果測試數(shù)據(jù)的第一個屬性屬于區(qū)間[-11, +8],必須將測試數(shù)據(jù)轉(zhuǎn)變成[-1.1, +0.8]。