楊少凡 余華兵 陳新華 孫長瑜
?
基于擴(kuò)展Kalman濾波的單領(lǐng)航者自主水下航行器協(xié)同導(dǎo)航判別式訓(xùn)練方法研究
楊少凡①②余華兵*①陳新華①孫長瑜①
①(中國科學(xué)院聲學(xué)研究所 北京 100190)②(中國科學(xué)院大學(xué) 北京 100049)
單領(lǐng)航者自主水下航行器(AUV)協(xié)同導(dǎo)航算法中,系統(tǒng)模型是非線性的,擴(kuò)展Kalman濾波(EKF)是針對非線性系統(tǒng)的很有影響力的濾波算法,但是,EKF算法的性能嚴(yán)格依賴于一系列模型參數(shù),而這些參數(shù)往往需要花費很大的代價來捕獲,并且常需要人工調(diào)整。該文應(yīng)用一種能自動學(xué)習(xí)Kalman濾波噪聲協(xié)方差參數(shù)的方法,通過仿真分析,證明了該學(xué)習(xí)算法可以完全自主并且高效、準(zhǔn)確地輸出Kalman濾波噪聲參數(shù),進(jìn)一步提高了單領(lǐng)航者AUV協(xié)同導(dǎo)航系統(tǒng)的導(dǎo)航精度。
自主水下航行器;協(xié)同導(dǎo)航;擴(kuò)展Kalman濾波;自動學(xué)習(xí)噪聲參數(shù)
隨著人工智能理論、傳感器和微計算機(jī)等技術(shù)的不斷成熟和發(fā)展,具有感知思維和動作能力的自主水下航行器(AUV)在軍事和民用領(lǐng)域得到了廣泛的應(yīng)用,如海洋勘測、水下情報搜集、遠(yuǎn)程水下攻擊等。就當(dāng)前的技術(shù)而言,水下導(dǎo)航問題仍然是AUV所面臨的主要挑戰(zhàn)之一。目前在水下環(huán)境中,AUV主要導(dǎo)航方法有航位推算與慣性導(dǎo)航方法、水聲導(dǎo)航方法、地球物理導(dǎo)航方法、仿生學(xué)導(dǎo)航方法和組合導(dǎo)航方法等[1,2]。單一導(dǎo)航系統(tǒng)往往很難滿足現(xiàn)代水下的導(dǎo)航要求,組合導(dǎo)航針對每種單一導(dǎo)航系統(tǒng)都有各自的獨特性能和局限性,把幾種單一系統(tǒng)組合起來,利用多種信息源,構(gòu)成一種有多余度和導(dǎo)航精確度更高的多功能系統(tǒng)[3]。新的數(shù)據(jù)處理方法,特別是Kalman濾波(KF)[4]方法的應(yīng)用是實現(xiàn)組合導(dǎo)航的關(guān)鍵。
本文研究有關(guān)EKF的一個基本問題:優(yōu)化系統(tǒng)模型參數(shù)來提高從AUV狀態(tài)估計精度[5]。實際應(yīng)用中即使?fàn)顟B(tài)預(yù)測方程和觀測方程可以精確建模,準(zhǔn)確估計噪聲協(xié)方差往往非常地困難。噪聲往往由若干不同的因素產(chǎn)生:(1)附加噪聲的測量數(shù)據(jù);(2)未被EKF建模的隱含環(huán)境狀態(tài)信息;(3)時間離散化引入的附加噪聲;(4)EKF算法本身的近似,如常用Taylor公式進(jìn)行線性近似。所有這些因素都會在狀態(tài)估計和觀測數(shù)據(jù)時引入干擾,在EKF中,它們通常被看作噪聲。
本文研究了3個學(xué)習(xí)算法,均應(yīng)用從AUV的GPS定位信息來學(xué)習(xí)EKF的協(xié)方差參數(shù)?;舅枷牒苤庇^:訓(xùn)練EKF來最大化它的預(yù)測精度,預(yù)測精度通過訓(xùn)練中獲取的參考數(shù)據(jù)來評估。
圖1 AUV的仿真真實路徑
擴(kuò)展Kalman濾波過程可以表示為
預(yù)測過程:
更新過程:
本節(jié)討論自動捕獲Kalman濾波的噪聲參數(shù)的學(xué)習(xí)算法。雖然接下來要討論的算法也可以應(yīng)用到更廣泛的方面,但為了研究簡單,我們只專注于學(xué)習(xí)噪聲參數(shù)和。除已有研究成果中所需要的測量數(shù)據(jù)外,此算法還需要一個能夠精確測量從AUV狀態(tài)的全部變量或部分變量的測量設(shè)備。換言之,在EKF學(xué)習(xí)階段,我們可以獲得額外的變量,每個變量由映射得到
3.1最大化聯(lián)合似然算法
可以觀察到,該算法實際上并沒有真正地訓(xùn)練EKF,而是簡單地訓(xùn)練濾波器元素。因此,這暗示了我們假想獨立訓(xùn)練濾波器元素和整體訓(xùn)練EKF濾波器的效果相同。
3.2最小化殘余預(yù)測誤差算法
最大化聯(lián)合似然函數(shù)算法僅當(dāng)可以測量完整的狀態(tài)向量時才可以應(yīng)用。但是,往往將完整狀態(tài)向量映射到低維的狀態(tài)向量,比如單領(lǐng)航者協(xié)同導(dǎo)航系統(tǒng)中,完整的狀態(tài)向量還包含航向角,這項不能直接由GPS數(shù)據(jù)獲得。此外,最大化條件似然函數(shù)的算法實際上并沒有真正運行EKF濾波器,特別地,若噪聲項是相關(guān)的,這將影響算法性能。
求解這個優(yōu)化問題比最大化聯(lián)合似然要困難得多,因為誤差函數(shù)不是簡單的和的函數(shù),而是通過狀態(tài)估計均值這個中間項來調(diào)節(jié),并且是和的復(fù)雜函數(shù)。因此,這個學(xué)習(xí)算法真正評估了EKF的性能,而不是它的獨立元素。
3.3 最大化預(yù)測似然算法
最大化lg似然函數(shù)變?yōu)?/p>
本文算法與最小化殘余預(yù)測誤差算法的不同之處是需要額外提供給EKF協(xié)方差矩陣參數(shù),以此來反映狀態(tài)估計量的穩(wěn)定性。
為驗證自動學(xué)習(xí)EKF濾波參數(shù)3個算法的有效性,進(jìn)行了仿真研究。如圖2所示,領(lǐng)航者AUV由坐標(biāo)原點出發(fā)沿直線航行,跟隨者AUV的航程分為兩段,首先沿斜線航行一段距離,然后與領(lǐng)航者保持平行航行。在兩段航程中跟隨者AUV的航向角分別為和。主、從AUV的航速均為2.5 m/s,系統(tǒng)的狀態(tài)更新時間。仿真中假設(shè)所有誤差均為零均值高斯噪聲。從AUV的速度信息通過測量自身推進(jìn)器的轉(zhuǎn)速獲得,誤差為。主、從AUV的航向角信息由陀螺儀測量,,。AUV間的相對距離通過水聲通信測量,相對方位通過聲波相位差量測,設(shè)聲速為定值,取和。GPS量測噪聲分別為和。
下面將分別研究初始系統(tǒng)可以獲得精確的噪聲參數(shù)和獲得的噪聲參數(shù)存在較大誤差時3個學(xué)習(xí)算法對EKF協(xié)同導(dǎo)航性能的影響。仿真中選擇400個測試點進(jìn)行導(dǎo)航性能分析,并采用RMS誤差進(jìn)行度量。
表1初始獲得精確的噪聲協(xié)方差參數(shù)時各算法定位誤差
協(xié)同導(dǎo)航算法RMS誤差(m) EKF13.2 最大聯(lián)合似然15.8 最小殘余預(yù)測誤差12.5 最大預(yù)測誤差12.6
4.1初始時刻系統(tǒng)可獲得精確的噪聲協(xié)方差參數(shù)時算法性能分析
仿真結(jié)果表明,當(dāng)初始給定協(xié)方差參數(shù)準(zhǔn)確時,EKF濾波算法的RMS誤差大約為13.2 m;最大聯(lián)合似然算法的RMS誤差約為15.8 m,誤差比EKF算法大,這是由于該算法并沒有真正訓(xùn)練EKF濾波器,而是訓(xùn)練獨立的濾波器元素,并假設(shè)這兩者等價,而實際的協(xié)同導(dǎo)航系統(tǒng)不完全服從該假設(shè)(比如存在相關(guān)噪聲),因此帶來較大誤差;最小殘余預(yù)測誤差算法與最大預(yù)測誤差算法的RMS誤差要小于EKF算法,這是由于通過訓(xùn)練EKF濾波器獲取了更優(yōu)的噪聲協(xié)方差參數(shù),即提取了EKF內(nèi)部的關(guān)聯(lián)信息,從而提高了導(dǎo)航精度。
圖2 AUV的仿真運動路徑?????圖3 從AUV的協(xié)同導(dǎo)航軌跡?????圖4 EKF算法定位誤差
圖5 最大化聯(lián)合似然算法定位誤差???圖6 最小殘余預(yù)測誤差算法定位誤差???圖7 最大化預(yù)測似然算法定位誤差
4.2 初始時刻系統(tǒng)獲得的噪聲協(xié)方差參數(shù)與實際參數(shù)存在較大偏差時算法性能分析
實際情況下,初始噪聲協(xié)方差參數(shù)很難獲得準(zhǔn)確值,往往存在較大誤差。假設(shè)實際的噪聲協(xié)方差參數(shù)分別為
仿真結(jié)果表明,當(dāng)初始時刻不能獲取準(zhǔn)確的噪聲協(xié)方差參數(shù)時,EKF濾波算法的RMS誤差大約為20.0 m。3個學(xué)習(xí)算法的RMS誤差分別為15.6 m, 13.0 m與13.2 m,可見學(xué)習(xí)算法大大提高了單領(lǐng)航者AUV協(xié)同導(dǎo)航系統(tǒng)的性能。
圖8 從AUV的協(xié)同導(dǎo)航軌跡??????圖9 EKF算法定位誤差??????圖10 最大化聯(lián)合似然算法定位誤差
圖11 最小殘余預(yù)測誤差算法定位誤差????????圖12 最大化預(yù)測似然算法定位誤差
表2初始誤差協(xié)方差參數(shù)設(shè)為大誤差值時算法定位誤差
協(xié)同導(dǎo)航算法RMS誤差(m) EKF20.0 最大聯(lián)合似然15.6 最小殘余預(yù)測誤差13.0 最大預(yù)測誤差13.2
本文應(yīng)用一系列算法來訓(xùn)練EKF的噪聲參數(shù)。所有的算法有相同的思想:通過調(diào)整EKF的噪聲協(xié)方差參數(shù)來最大化系統(tǒng)狀態(tài)預(yù)測精度。仿真結(jié)果表明,訓(xùn)練算法與常規(guī)EKF算法相比有兩個優(yōu)點。第一,它完全自動搜索噪聲協(xié)方差參數(shù),解決了人工調(diào)節(jié)費時費力的缺點。第二,通過訓(xùn)練學(xué)習(xí)獲得的噪聲協(xié)方差參數(shù)比初始的噪聲參數(shù)更優(yōu),從而提高了協(xié)同導(dǎo)航系統(tǒng)精度。
[1] Paull L, Saeedi S, Seto M,. AUV navigation and localization: A review[J].,2014, 39(4): 131-149.
[2] Liu Ming-yong, Li Hong, and Liu Kun. Geomagnetic navigation of AUV without a priori magnetic map[C]. MTS/ IEEE OCEANS, Taipei, 2014: 1-5.
[3] 劉明雍. 水下航行器協(xié)同導(dǎo)航技術(shù)[M]. 北京: 國防工業(yè)出版社, 2014: 1-117.
Liu Ming-yong. Cooperative Navigation Technology for Underwater Vehicles[M]. Beijing: National Defence Industry Press, 2014: 1-117.
[4] Kalman R. A new approach to linear filtering and prediction problems[J].,1960, 82(Series D): 35-45.
[5] Abbeel P, Coates A, Montemerlo M,. Discriminative training of Kalman filters[C]. Robotic: Science and Systems, Cambridge, 2005: 289-296.
[6] Zhang Li-chuan, Xu De-min, Liu Ming-yong,. Cooperative navigation and localization for multiple UUVs [J]., 2009, 8(3): 216-221.
[7] Fallon M, Papadopoulos G, Lenorad J,. Cooperative AUV navigation using a single maneuvering surface craft[J]., 2011, 29(12): 1461-1474.
[8] 李聞白, 劉明雍, 李虎雄,等. 基于單領(lǐng)航者相對位置測量的多AUV協(xié)同導(dǎo)航系統(tǒng)定位性能分析[J]. 自動化學(xué)報, 2011, 37(6): 724-736.
Li Wen-bai, Liu Ming-yong, Li Hu-xiong,.. Localization performance analysis of cooperative navigation system for multiple AUVs based on relative position measurements with a single leader[J]., 2011, 37(6): 724-736.
[9] Liu Ming-yong, Li Wen-bai, Mu Bing-xian,. Cooperative navigation for multiple AUVs based on relative range measurements with a single leader[C]. IEEE International Conference on Intelligent Computing and Intelligent Systems, Xiamen, 2010: 762-766.
[10] Liu Jian, Xu De-min, Zhang Fu-bin,. Research on cooperative navigation for multiple UUVs[C]. International Symposium on Instrumentation & Measurement, Sensor Network and Automation, Sanya, 2012: 248-251.
[11] Maki T, Matsuda T, Sakamaki T,. Navigation method for underwater vehicles based on mutual acoustical positioning with a single seafloor station[J].,2013, 38(1): 167-176.
[12] Teo K, Goh B, and Chai O. Fuzzy docking guidance using augmented navigation system on an AUV[J].,2014, 40(2): 1-13.
[13] Roumeliotis S and Bekey G. Distributed multirobot localization[J]., 2002, 18(5): 781-795.
[14] Roweis S and Ghahramani Z. A unifying review of linear Gaussian models[J].,1999, 11(2): 305-345.
Discriminative Training of Kalman Filters Based Cooperative Navigation for Multiple Autonomous Underwater Vehicles with a Single Leader
Yang Shao-fan①②Yu Hua-bing①Chen Xin-hua①Sun Chang-yu①
①(,,100190,)②(,100049,)
In the cooperative navigation algorithm for multiple Autonomous Underwater Vehicles (AUVs)with a single leader, the model of the systemis nonlinear. The Extended Kalman Filter (EKF), which is directed against the nonlinear system, is one of the most influential techniques. However, the performance of EKF critically depends on a large number of modeling parameters which can be very difficult to obtain, and are often set by manual tweaking and at a great cost. In this paper, a method for automatically learning the noise covariance of a Kalman filter is applied, and the simulation result shows that this algorithm fully automatically and quickly outputs the noise covariance, which improves the navigation accuracy of the cooperative navigation system.
Autonomous Underwater Vehicle (AUV); Cooperative navigation; Extended Kalman Filter (EKF); Automatically learning the noise parameters
TB568
A
1009-5896(2015)11-2756-06
10.11999/JEIT150036
2015-01-08;改回日期:2015-06-02;
2015-07-06
余華兵 yuhuabing@mail.ioa.ac.cn
國家自然科學(xué)基金(61372180)
The National Natural Science Foundation of China (61372180)
楊少凡: 男,1991年生,博士生,研究方向為多AUV協(xié)同導(dǎo)航、定位、水聲陣列信號處理.
余華兵: 男,1975年生,研究員,研究方向為水聲陣列信號處理.
陳新華: 男,1978年生,副研究員,研究方向為水聲信號處理.
孫長瑜: 男,1954年生,研究員,研究方向為水聲陣列信號處理.