粒子濾波介紹
粒子濾波
與卡爾曼濾波(Kalman Filter)相比較粒子濾波(PF: Particle Filter)的思想基于蒙特卡洛方法(Monte Carlo methods),它是利用粒子集來表示概率,可以用在任何形式的狀態(tài)空間模型上。其核心思想是通過從后驗概率中抽取的隨機狀態(tài)粒子來表達其分布,是一種順序重要性采樣法(Sequential Importance Sampling)。簡單來說,粒子濾波法是指通過尋找一組在狀態(tài)空間傳播的隨機樣本對概率密度函數(shù)進行近似,以樣本均值代替積分運算,從而獲得狀態(tài)最小方差分布的過程。這里的樣本即指粒子,當(dāng)樣本數(shù)量
時可以逼近任何形式的概率密度分布。盡管算法中的概率分布只是真實分布的一種近似,但由于非參數(shù)化的特點,它擺脫了解決非線性濾波問題時隨機量必須滿足高斯分布的制約,能表達比高斯模型更廣泛的分布,也對變量參數(shù)的非線性特性有更強的建模能力。因此,粒子濾波能夠比較精確地表達基于觀測量和控制量的后驗概率分布,可以用于解決SLAM問題。
粒子濾波的應(yīng)用
粒子濾波技術(shù)在非線性、非高斯系統(tǒng)表現(xiàn)出來的優(yōu)越性,決定了它的應(yīng)用范圍非常廣泛。另外,粒子濾波器的多模態(tài)處理能力,也是它應(yīng)用廣泛的原因之一。國際上,粒子濾波已被應(yīng)用于各個領(lǐng)域。在經(jīng)濟學(xué)領(lǐng)域,它被應(yīng)用在經(jīng)濟數(shù)據(jù)預(yù)測;在軍事領(lǐng)域已經(jīng)被應(yīng)用于雷達跟蹤空中飛行物,空對空、空對地的被動式跟蹤;在交通管制領(lǐng)域它被應(yīng)用在對車或人視頻監(jiān)控;它還用于機器人的全局定位。
粒子濾波的缺點
雖然粒子濾波算法可以作為解決SLAM問題的有效手段,但是該算法仍然存在著一些問題。其中最主要的問題是需要用大量的樣本數(shù)量才能很好地近似系統(tǒng)的后驗概率密度。機器人面臨的環(huán)境越復(fù)雜,描述后驗概率分布所需要的樣本數(shù)量就越多,算法的復(fù)雜度就越高。因此,能夠有效地減少樣本數(shù)量的自適應(yīng)采樣策略是該算法的重點。另外,重采樣階段會造成樣本有效性和多樣性的損失,導(dǎo)致樣本貧化現(xiàn)象。如何保持粒子的有效性和多樣性,克服樣本貧化,也是該算法研究重點。
進展與展望
粒子濾波器的應(yīng)用領(lǐng)域
在現(xiàn)代目標跟蹤領(lǐng)域,由于實際問題的復(fù)雜性,所面對的更多的是非線性非高斯問題,Hue等把PF推廣到多目標跟蹤和數(shù)據(jù)關(guān)聯(lián),Gordon等對雜波中的目標跟蹤問題提出混合粒子濾波器弼,Mcginnity等提出機動目標跟蹤的多模型粒子濾波器,Doucet等對跳躍Markov系統(tǒng)狀態(tài)估計提出了更有效的PF算法 j,Guo把PF用于傳感器網(wǎng)絡(luò)下的協(xié)同跟蹤 J,F(xiàn)reitas等用PF訓(xùn)練神經(jīng)網(wǎng)絡(luò),Srivastava等把PF用于自動目標識別,F(xiàn)ox等把PF用于移動機器人定位,Ward等提出語音源定位的PF算法,Orton等對來自多個傳感器的無序量測提出基于PF的多目標跟蹤和信息融合方法,Penny等使用PF實現(xiàn)多傳感器資源最優(yōu)管理和部署,Hernandez等結(jié)合PF、數(shù)據(jù)融合和優(yōu)化算法實現(xiàn)多傳感器資源管理 .研究表明PF是解決此類非線性問題的有力工具之一.PF在計算機視覺、可視化跟蹤領(lǐng)域被稱為凝聚算法(CONDENsATION),該領(lǐng)域是PF的一個非?;钴S的應(yīng)用領(lǐng)域,Bruno提出圖像序列中目標跟蹤的PF算法,Maskell等提出基于圖像傳感器多目標跟蹤的PF算法_4 .在聽覺視覺聯(lián)合目標定位和跟蹤方面,Vermaak等利用PF提出聲音和視覺融合的集成跟蹤,Zotkin等使用PF將來自多個攝像機和麥克風(fēng)組的視覺聽覺信息融合跟蹤移動目標。
在粒子濾波算法下一些傳統(tǒng)的難點問題如目標檢測、遮擋、交叉、失跟等得到更好的結(jié)果.在無線通訊中PF被廣泛用于信道盲均衡、盲檢測、多用戶檢測等方面.其它的應(yīng)用領(lǐng)域還有機器人視覺跟蹤、導(dǎo)航、圖象處理、生物信息 引、故障診斷和過程控制、金融數(shù)據(jù)處理 等.研究表明在有關(guān)非高斯非線性系統(tǒng)的數(shù)據(jù)處理和分析領(lǐng)域PF都具有潛在的應(yīng)用價值.值得一提的是國內(nèi)學(xué)者在PF的研究上也取得許多成果,莫等利用PF算法提出一種混合系統(tǒng)狀態(tài)監(jiān)測與診斷的新方法,Chen等利用PF預(yù)測非線性系統(tǒng)狀態(tài)分布,獲得故障預(yù)測概率,Li等提出基于PF的可視化輪廓跟蹤方法 J,Shan等提出基于PF的手形跟蹤識別方法,Hu等提出閃爍噪聲下的PF跟蹤算法 等,這些工作推動PF在國內(nèi)的研究.
粒子方法的新發(fā)展
粒子濾波器采用一組隨機粒子逼近狀態(tài)的后驗概率分布,有可能用粒子逼近平滑分布,由于重采樣使得粒子喪失多樣性,直接由濾波分布邊緣化得到的平滑分布效果很差,Doucet等應(yīng)用MCMC方法增加樣本多樣性用于固定延遲平滑取得好的效果,F(xiàn)ong等把RBPF推廣到粒子平滑器,并用于語音信號處理 1.
在PF的性能優(yōu)化方面,目前大多優(yōu)化某個局部的性能指標,如重要性權(quán)的方差等,Doucet等使用隨機逼近對PF關(guān)于某個全局性能指標進行在線優(yōu)化,Chan等人進一步利用SPSA隨機優(yōu)化方法優(yōu)化PF ,避免1r梯度的計算.為了減少計算量使得PF能用于實時數(shù)據(jù)處理,F(xiàn)oxt提出了粒子個數(shù)可變的自適應(yīng)粒子濾波器,Kwok等把粒子劃分為小的集合,每個小樣本集可以進行實時處理,采用加權(quán)和的方法逼近狀態(tài)后驗分布,Brun等提出PF的并行結(jié)構(gòu)算法以獲得在線實時應(yīng)用 .
最近幾年,粒子方法出現(xiàn)了又一些新的發(fā)展,一領(lǐng)域用傳統(tǒng)的分析方法解決不了的問題,現(xiàn)在可以借助基于粒子仿真的方法來解決.在動態(tài)系統(tǒng)的模型選擇,故障檢測、診斷方面,出現(xiàn)了基于粒子的假設(shè)檢驗、粒子多模型、粒子似然度比檢測等方法.在參數(shù)估計方面,通常把靜止的參數(shù)作為擴展的狀態(tài)向量的一部分,但是由于參數(shù)是靜態(tài)的,粒子會很快退化成一個樣本,為避免退化,常用的方法有給靜參數(shù)人為增加動態(tài)噪聲_9 以及Kernel平滑方法,而Doucet等提出的點估計方法避免對參數(shù)直接采樣,在粒子框架下使用最大似然估計(ML)以及期望值最大(EM)算法直接估計未知參數(shù) .在隨機優(yōu)化方面,出現(xiàn)了基于粒子方法的梯度估計算法,使得粒子方法也用于最優(yōu)控制等領(lǐng)域.Andrieu,Doucet等在文獻中詳細回顧了粒子方法在變化檢測、系統(tǒng)辨識和控制中的應(yīng)用及理論上的一些最新進展,許多僅僅在幾年前不能解決的問題現(xiàn)在可以求助于這種基于仿真的粒子方法.
總結(jié)與展望(Summarization and prospect)
目前粒子濾波器的研究已取得許多可喜的進展,應(yīng)用范圍也由濾波估計擴展到新的領(lǐng)域,作為一種新方法,粒子方法還處于發(fā)展之中,還存在許多有待解決的問題,例如隨機采樣帶來Monte Carlo誤差的積累甚至導(dǎo)致濾波器發(fā)散、為避免退化和提高精度而需要大量的粒子使得計算量急劇增加、粒子方法是否是解決非線性非高斯問題的萬能方法還值得探討.此外粒子濾波器還只是停留在仿真階段,全面考慮實際中的各種因素也是深化PF研究不可缺少的一個環(huán)節(jié).盡管如此,在一些精度要求高而經(jīng)典的分析方法又解決不了的場合,這種基于仿真的逼近方法發(fā)揮了巨大潛力,而現(xiàn)代計算機和并行計算技術(shù)的迅速發(fā)展又為粒子方法的發(fā)展和應(yīng)用提供了有力支持,相信粒子濾波器的研究將朝著更深,更廣的方向發(fā)展.
粒子濾波發(fā)展
MCMC改進策略
馬爾可夫鏈蒙特卡洛(MCMC)方法通過構(gòu)造Markov鏈,產(chǎn)生來自目標分布的樣本,并且具有很好的收斂性。在SIS的每次迭代中,結(jié)合MCMC使粒子能夠移動到不同地方,從而可以避免退化現(xiàn)象,而且Markov鏈能將粒子推向更接近狀態(tài)概率密度函數(shù)(probability density function,(PDF))的地方,使樣本分布更合理?;贛CMC改進策略的方法有許多,常用的有Gibbs采樣器和MetropolisHasting方法。
Unscented粒子濾波器(UPF)
Unscented Kalman濾波器(UKF)是Julier等人提出的。EKF(Extended Kalman Filter)使用一階Taylor展開式逼近非線性項,用高斯分布近似狀態(tài)分布。UKF類似于EKF,用高斯分布逼近狀態(tài)分布,但不需要線性化只使用少數(shù)幾個稱為Sigma點的樣本。這些點通過非線性模型后,所得均值和方差能夠精確到非線性項Taylor展開式的二階項,從而對非線性濾波精度更高。Merwe等人提出使用UKF產(chǎn)生PF的重要性分布,稱為Unscented粒子濾波器(UPF),由UKF產(chǎn)生的重要性分布與真實狀態(tài)PDF的支集重疊部分更大,估計精度更高。
Rao-Blackwellised粒子濾波器(RBPF)
在高維狀態(tài)空間中采樣時,PF的效率很低。對某些狀態(tài)空間模型,狀態(tài)向量的一部分在其余部分的條件下的后驗分布可以用解析方法求得,例如某些狀態(tài)是條件線性高斯模型,可用Kalman濾波器得到條件后驗分布,對另外部分狀態(tài)用PF,從而得到一種混合濾波器,降低了PF采樣空間的維數(shù),RBPF樣本的重要性權(quán)的方差遠遠低于SIR方法的權(quán)的方差,為使用粒子濾波器解決 SLAM問題提供了理論基礎(chǔ)。而Montemerlo等人在2002年首次將Rao-Blackwellised粒子濾波器應(yīng)用到機器人SLAM中,并取名為FastSLAM算法。該算法將SLAM問題分解成機器人定位問題和基于位姿估計的環(huán)境特征位置估計問題,用粒子濾波算法做整個路徑的位置估計,用EKF估計環(huán)境特征的位置,每一個EKF對應(yīng)一個環(huán)境特征。該方法融合EKF和概率方法的優(yōu)點,既降低了計算的復(fù)雜度,又具有較好的魯棒性。
最近幾年,粒子方法又出現(xiàn)了一些新的發(fā)展,一些領(lǐng)域用傳統(tǒng)的分析方法解決不了的問題,現(xiàn)在可以借助基于粒子仿真的方法來解決。在動態(tài)系統(tǒng)的模型選擇、故障檢測、診斷方面,出現(xiàn)了基于粒子的假設(shè)檢驗、粒子多模型、粒子似然度比檢測等方法。