龐菲菲,溫祥西,王曉華
(1.西安工程大學(xué) 電子信息學(xué)院,西安 710048;2.空軍工程大學(xué) 空管領(lǐng)航學(xué)院,西安 710051)
對水下目標(biāo)的精確定位可以為水下目標(biāo)的安全航行、打撈救生以及海洋資源開發(fā)提供基礎(chǔ),成為當(dāng)前研究的熱點(diǎn)[1-5]?;诜轿唤堑亩ㄎ环椒ǜ鶕?jù)多個節(jié)點(diǎn)估計的方位角對目標(biāo)進(jìn)行定位,是一種經(jīng)典的被動無源定位技術(shù),廣泛應(yīng)用于水聲傳感網(wǎng)絡(luò)中。受復(fù)雜多變的水聲環(huán)境、多徑效應(yīng)、硬件失效、沖擊噪聲等的影響,節(jié)點(diǎn)測量的方位角可能會嚴(yán)重偏離真實(shí)的方位角,即出現(xiàn)異常值的情況,對目標(biāo)定位精度造成嚴(yán)重影響[6]。
針對異常值出現(xiàn)的目標(biāo)定位問題,現(xiàn)有的解決方法主要有兩種:一種是采用基于魯棒的統(tǒng)計估計方法以減小定位過程中異常值引起的負(fù)面影響;另一種是篩選出異常值并在定位時將其剔除,避免其對定位的影響。文獻(xiàn)[7]使用魯棒的統(tǒng)計估計方法,將lp范數(shù)最小化作為優(yōu)化目標(biāo)函數(shù),然后采用迭代加權(quán)輔助變量估計方法進(jìn)行求解。該方法需要迭代運(yùn)算,不能得到解析解,運(yùn)算量較大。文獻(xiàn)[8]使用魯棒最小二乘準(zhǔn)則構(gòu)造目標(biāo)函數(shù),通過求解廣義信賴域子問題得到準(zhǔn)確解,以減輕異常值對定位偏差的影響。文獻(xiàn)[9]通過k-means聚類算法排除誤差較大的測距信息,最后利用剩余距離信息進(jìn)行目標(biāo)定位。該方法可在不增加通信開銷的前提下,得到更精確、容錯性更高的定位方法。文獻(xiàn)[10]認(rèn)為異常值嚴(yán)重偏離了其余節(jié)點(diǎn)的觀測信息,結(jié)合幾何學(xué)和統(tǒng)計方法提出了到達(dá)時間差的異常信息檢測方法。文獻(xiàn)[11]利用長基線/超短基線組合系統(tǒng),并采用k-means聚類算法和決策融合對多種定位參量中的異常值進(jìn)行檢測,通過識別并去除異常值保證了定位系統(tǒng)的可靠性。這種剔除異常值的方法可以從根源上避免異常信息對定位結(jié)果的影響。
文獻(xiàn)[12]指出:測向線所給信息是目標(biāo)定位和分選的全部依據(jù);一條測向線說明目標(biāo)可能在離線很近的地方,而很少可能在離線很遠(yuǎn)的地方。因此,當(dāng)所有節(jié)點(diǎn)測量的方位信息都較為準(zhǔn)確時,方位交線產(chǎn)生的目標(biāo)初始估計位置會緊密分布在目標(biāo)真實(shí)位置附近;而當(dāng)節(jié)點(diǎn)觀測的方位信息出現(xiàn)異常時,異常值對應(yīng)的目標(biāo)初始估計位置會遠(yuǎn)離于其余初始位置。利用這一分布特征,本文針對異常值出現(xiàn)的情況,提出了基于支持向量數(shù)據(jù)描述(support vector data description,SVDD)的目標(biāo)定位方法。該方法將目標(biāo)定位與異常值識別有機(jī)結(jié)合,首先使用SVDD對方位交線方法所產(chǎn)生的目標(biāo)初始估計位置進(jìn)行一分類處理,然后利用位于超球面外的外點(diǎn)識別出異常值并將其剔除,最后利用剩余的方位信息對目標(biāo)進(jìn)行定位。本文方法可以有效篩選出異常值,避免異常值對定位精度的影響。
圖1 方位觀測模型
(1)
當(dāng)有異常情況出現(xiàn)時,第i個節(jié)點(diǎn)觀測的方位信息利用高斯混合模型表示
(2)
式中:τi∈{0,1}為獨(dú)立同分布的Bernoulli隨機(jī)變量,代表是否有異常值出現(xiàn),若有異常值則τi=1,反之τi=0,假設(shè)異常值出現(xiàn)的概率為pi=Pr{τi=1};mi為在[-π,π]均勻分布的沖擊噪聲。
i,j=1,2,…,M且i≠j
(3)
(4)
式中,[xi,yi],[xj,yj]分別為第i,j個節(jié)點(diǎn)的坐標(biāo)。
圖2 目標(biāo)位置的初始估計分布
因此,可以根據(jù)目標(biāo)位置初始估計值的分布特征篩選出異常值,將其剔除后再利用其余正常觀測方位信息對目標(biāo)位置進(jìn)行估計,這種方法可以從根本上避免異常信息對目標(biāo)定位精度的影響。從所有初始估計值中篩選離散點(diǎn)(異常值引起的初始估計值)的過程可由單分類算法來實(shí)現(xiàn)。SVDD方法作為一種單分類器,可在給定的一個數(shù)據(jù)集周圍確定一個閉合的超球體,使該超球體能夠幾乎包含所有數(shù)據(jù)樣本的最小超球體,因此本文利用SVDD方法劃定類別邊界進(jìn)行離散點(diǎn)檢測。
支持向量機(jī)由Vapnik[14]于20世紀(jì)90年代提出,最初用于解決二分類問題。隨后,Tax等[15]將統(tǒng)計學(xué)習(xí)理論通過支持向量機(jī)的形式擴(kuò)展到無指導(dǎo)學(xué)習(xí)領(lǐng)域,提出了一種新的數(shù)據(jù)描述方法——SVDD方法。SVDD方法是一種單分類方法,其基本思想是:通過非線性變換將目標(biāo)樣本映射到一個高維的特征空間,在高維空間建立一個封閉而緊湊的最小超球體,權(quán)衡超球體半徑和它所包含的樣本映像的數(shù)目,使其包含的樣本映像數(shù)量最多[16]。
由于異常值的影響,數(shù)據(jù)集的樣本特征不是集中分布的,而是存在離散的數(shù)據(jù)分布。這些樣本的分布存在以下三種可能:
(1)對應(yīng)樣本Xi到超球體球心的距離小于R,即該樣本在球體內(nèi),稱為內(nèi)點(diǎn);
(2)對應(yīng)的樣本Xi位于超球面上,稱為支持向量;
(3)若Xi落在超球體外,稱為外點(diǎn)(即離散點(diǎn))。
外點(diǎn)是由異常值引起的,由于每個樣本都對應(yīng)了兩個節(jié)點(diǎn)的測量值(參見式(3)),因此可由外點(diǎn)反推出異常值。將異常值剔除后,使用剩余的方位信息求解得到最終的目標(biāo)位置。
基于SVDD去除異常值的目標(biāo)定位方法具體步驟為:
步驟1每個節(jié)點(diǎn)分別對目標(biāo)進(jìn)行方位估計,利用方位交線方法,得到N個交點(diǎn)X1,X2,…,XN,將其作為樣本集;
步驟2利用SVDD方法對樣本集進(jìn)行分類,檢測出外點(diǎn);
步驟3找出每個外點(diǎn)所對應(yīng)的兩個方位信息序號,并統(tǒng)計序號的出現(xiàn)次數(shù);篩選出現(xiàn)次數(shù)大于等于t的所有序號,將這些序號對應(yīng)的觀測值視為異常值,假設(shè)篩選出的異常值個數(shù)為n;
(5)
其中,
(6)
在所提的方法中,t起到了一個門限的作用,即:如果外點(diǎn)對應(yīng)的方位統(tǒng)計次數(shù)大于等于t,則認(rèn)為該方位信息為異常值。如果t的值越大,則認(rèn)定某個方位信息為異常值的門限越高,即有可能識別不出異常值;反之,門限越低,意味著可能會將正常方位信息誤判為異常值,出現(xiàn)虛警的情況。在實(shí)際應(yīng)用中,t的大小與異常值出現(xiàn)的概率pi、方位估計誤差的標(biāo)準(zhǔn)差σi有關(guān)。當(dāng)pi增大時,外點(diǎn)的個數(shù)也會增加,t的值應(yīng)該適當(dāng)增大;反之,t的值應(yīng)適當(dāng)減小。另一方面,當(dāng)正常方位估計誤差的σi比較大時,利用該方位信息得到的目標(biāo)初始估計位置會越偏離目標(biāo)真實(shí)位置,從而被SVDD方法識別為外點(diǎn)的概率也會增加,因此需要適當(dāng)增加t的值,避免造成誤判;反之,可適當(dāng)減小t的值,降低門限,提高異常值的識別概率。
本文分別采用LS估計方法、基于k-means聚類算法的定位方法與本文所提基于SVDD方法去異常值后使用LS(LS after removing unreliable measurements based on SVDD,SVDD-LS)定位方法進(jìn)行定位精度比較。其中,LS估計方法是使用所有觀測值、利用LS估計方法得到目標(biāo)位置;基于k-means聚類算法的定位方法是指先采用k-means聚類算法找出異常值并將其剔除,使用剩余觀測值、利用LS估計得到目標(biāo)位置,簡稱為基于k-means聚類算法去異常值后使用LS(LS after removing unreliable measurements based on k-means,k-means-LS)定位方法。定位精度選取均方根誤差(root-mean-square error,RMSE)來衡量,計算公式為
(7)
假設(shè)M個節(jié)點(diǎn)隨機(jī)均勻分布在5 000 m×5 000 m的區(qū)域內(nèi);目標(biāo)位于[2 500 m,2 500 m]。每個節(jié)點(diǎn)方位估計誤差ni的標(biāo)準(zhǔn)差σi都相等;每個節(jié)點(diǎn)出現(xiàn)異常的概率pi相等。SVDD方法中懲罰因子取0.2,選用高斯函數(shù)作為核函數(shù),核帶寬選取500。k-means聚類算法中聚類的個數(shù)為2,篩選類內(nèi)元素個數(shù)最少的聚類個數(shù)為1。蒙特卡洛仿真次數(shù)為1 000。
(1)pi對SVDD-LS方法定位精度的影響
當(dāng)有10個節(jié)點(diǎn),且每個節(jié)點(diǎn)方位估計誤差的標(biāo)準(zhǔn)差均σi為1°時,圖3比較了SVDD-LS方法在t的值分別為3,4,5,6時的RMSE隨異常值出現(xiàn)概率pi的變化情況。當(dāng)t=3,pi≥0.03和t=4,pi=0.11時的RMSE均超過了1 000 m,所以在圖3中沒有顯示出來。
圖3 均方根誤差隨異常值出現(xiàn)概率的變化情況
3.2.2σi對定位精度的影響
本節(jié)討論方位估計誤差的標(biāo)準(zhǔn)差σi對LS、k-means-LS和SVDD-LS這三種方法定位精度的影響。假設(shè)每個節(jié)點(diǎn)出現(xiàn)異常的概率pi=0.01。當(dāng)M=10時,圖4比較了LS、k-means-LS和SVDD-LS這三種方法的RMSE隨σi的變化情況。其中,σi的值由0.5°逐漸增加到7°,步長為0.5°,SVDD-LS的兩條曲線分別是在t的取值為4和6的情況下繪制的。本節(jié)將LS方法的定位精度作為對比基準(zhǔn),k-means-LS和SVDD-LS方法都與LS方法進(jìn)行比較。
由圖4可以看出,隨著σi的增加,三種方法的RMSE都隨之增加。當(dāng)σi≤3°時,k-means-LS方法的RMSE有所減??;但是隨著σi的進(jìn)一步增大,k-means-LS的定位精度逐漸降低,其RMSE甚至超過了LS方法,這是由于σi越大時,目標(biāo)初始估計位置會越來越偏離目標(biāo)真實(shí)位置,使樣本愈加離散,k-means聚類算法在這種情況下不能很好地準(zhǔn)確識別出異常值,導(dǎo)致k-means-LS方法的定位性能越來越差。對于SVDD-LS方法,當(dāng)t=4時,其在方位估計誤差較小時(σi≤3°)的RMSE最低;在3<σi≤5的區(qū)間內(nèi),t=4和t=6兩條曲線幾乎重疊,此時定位精度接近;當(dāng)定位誤差增加到更大的值時(σi>5°),目標(biāo)初始估計位置的分布會更加分散,當(dāng)門限t比較小時,容易出現(xiàn)誤判的情況,造成t=4對應(yīng)的RMSE快速增加,當(dāng)t增加到6時,SVDD-LS方法的RMSE最低,仍能表現(xiàn)出較好的定位性能。
圖4 均方根誤差隨方位估計誤差標(biāo)準(zhǔn)差的變化情況
3.2.3M對定位精度的影響
當(dāng)pi=0.01時,圖5比較了LS、k-means-LS和SVDD-LS三種方法的RMSE隨節(jié)點(diǎn)個數(shù)M的變化情況,其中,圖5(a)中的參數(shù)設(shè)置為σi=1°,t=4,圖5(b)中的σi=4°,t=9。
圖5 均方根誤差隨節(jié)點(diǎn)個數(shù)的變化情況
由圖5可看出,當(dāng)節(jié)點(diǎn)個數(shù)由5逐漸增加到17時,三種方法的RMSE都隨之下降,但是LS方法的RMSE仍然是最大的,這說明異常值的出現(xiàn)使LS方法的定位性能下降,而通過剔除異常值的辦法可以避免其對定位精度的影響,提高目標(biāo)定位精度。在三種方法中,SVDD-LS方法的RMSE降幅最大,表明該方法可以有效提高定位性能。當(dāng)異常值出現(xiàn)概率pi較小且一定時,M的增加意味著樣本個數(shù)和內(nèi)點(diǎn)個數(shù)的增加。如果σi較小,即使內(nèi)點(diǎn)個數(shù)增加,但是其依然會較緊密地圍繞在目標(biāo)真實(shí)位置附近,SVMM-LS方法仍然可以較好地識別出外點(diǎn),展現(xiàn)出較好的定位性能,見圖5(a);而當(dāng)σi較大時,內(nèi)點(diǎn)數(shù)量的增加會使樣點(diǎn)分布更加分散,可通過適量調(diào)高門限t避免誤判,使SVMM-LS方法維持較低的RMSE,見圖5(b)。
本文針對異常值影響目標(biāo)定位精度的問題,基于SVDD方法提出了去除異常值的目標(biāo)定位方法。該方法利用“異常值產(chǎn)生的目標(biāo)位置初始估計值遠(yuǎn)離真實(shí)位置、正常觀測值產(chǎn)生的初始估計值接近真實(shí)位置”的分布特征,首先采用SVDD方法對外點(diǎn)進(jìn)行檢測從而篩選出異常值,然后在使用LS估計方法計算目標(biāo)位置時將異常值剔除、僅使用其余正常觀測值,因此可以從根源上避免異常值對定位精度的影響。仿真結(jié)果表明,該方法可以有效識別異常值,其定位精度優(yōu)于LS和k-means-LS定位方法。