常安琪 喬宏樂 徐 偉
(西安電子工程研究所 西安 710100)
PRI分選的本質是對信號到達時間(Time Of Arrival,TOA)的去交錯處理。1989年,H.K.Mardia在基于序列搜索法和統(tǒng)計直方圖法的基礎上提出了累積差值直方圖法(CDIF)[1],具有一定的抗脈沖丟失性能,但計算量較大; 1992年,Milojevie等人在改進和完善累積差直方圖法的基礎上提出了序列差值直方圖法(SDIF)[2],該方法在運算速率和防止虛假目標方面均有較為顯著的提升。 1993 年 Nelson 提出了經典的 PRI變換算法[3],可較好地抑制直方圖中的諧波分量,但抗抖動效果較差。近些年的PRI分選處理除了在上述經典算法基礎上進行改進以外,也越來越多地引入了聚類算法,如2007年國強針對未知輻射源信號的預分選提出了 K-means 聚類算法與支持向量聚類算法[4]等等。
本文分析對照了基于DBSCAN聚類和曲線擬合的PRI分選算法和基于SDIF的PRI分選算法。與常用的Kmeans聚類相關算法比較,DBSCAN聚類算法亦具有以下優(yōu)勢:一是不需要輸入劃分聚類的個數(shù);二是聚類簇的形狀沒有偏倚(K-means適用于球形類數(shù)據簇);三是可以在需要時輸入過濾噪聲的參數(shù)。與傳統(tǒng)的PRI搜索算法比較,曲線擬合可以有效降低野值點的影響,提高正確分選效率。
DBSCAN(density based spatial clustering of applications with noise)[5]算法是一種典型的基于密度的聚類方法,可以發(fā)現(xiàn)任何形狀的簇,具有良好的噪聲識別性能。其工作原理是根據預設密度閾值確定劃分為某一個類的數(shù)值門限,將密度足夠高的區(qū)域進行聚類。
DBSCAN具體算法流程如圖1所示。
圖1 DBSCAN聚類算法流圖
在輸入數(shù)據集之前,DBSCAN算法需要確定兩個核心參數(shù),Eps鄰域半徑及MinPts 閾值門限,即給定在Eps鄰域半徑內成為核心對象的最小點數(shù)。如圖1所示,D表示待分類的數(shù)據集,i、j表示數(shù)據集D中的元素下標。其中,Eps的選取將會對聚類效果會產生很大影響。Eps選擇過小,眾多數(shù)據難以正常聚類,被識別為異常點;Eps選取過大,總體聚類類別數(shù)減小,異常點無法識別且聚類效果差[6]。
Eps和MinPts的值可根據工程的實際需求確定。例如,假設工程所需PRI識別精度為1μs,則可給定鄰域半徑Eps為1μs。在Eps確定的情況下,可統(tǒng)計數(shù)據集中每個點的Eps領域內點的個數(shù),通過對全數(shù)據集中每個點對應該數(shù)值求數(shù)學期望得到MinPts[7],此時MinPts為每個聚類中核心對象Eps內數(shù)據點個數(shù)的最優(yōu)值。MinPts的計算公式為
(1)
其中,pi為點i的Eps領域內點的個數(shù)。
基于PRI的雷達信號分選通常分為兩個步驟,第一個步驟是對目標雷達信號的PRI進行估計;第二個步驟是根據估計出的PRI值在混疊脈沖序列中進行序列搜索,提取出該PRI值對應的所有脈沖序列。
假設TOAn(n=1,2,…,N)表征脈沖到達時間序列,那么TOA1表示第 1 個脈沖的到達時間,TOAN表示第N個脈沖的到達時間。那么對脈沖序列到達時間進行三級差值處理可得:
Arr1=TOA2-TOA1,…,TOAN-TOAN-1
(2)
Arr2=TOA3-TOA1,…,TOAN-TOAN-2
(3)
Arr3=TOA4-TOA1,…,TOAN-TOAN-3
(4)
將上述三式疊加可得:
Arr=Arr1+Arr2+Arr3
(5)
以三組脈沖重復間隔值分別為PRI1=187、PRI2=230、PRI3=300為例,噪聲水平為10%,混疊到達時間(TOA)序列的三級差值序列圖如圖2所示。
圖2 一/二/三階TOA差值分布圖
如圖2所示,數(shù)據點在187μs和230μs處呈現(xiàn)出明顯的聚集狀態(tài),因此可以通過基于密度的聚類方式對TOA序列差值進行處理。
在同一電磁環(huán)境下,Eps的取值可以通過事先使用實測信號進行預聚類,觀察聚類結果來確定。根據DBSCAN聚類輸入參數(shù)選取原則,鄰域半徑Eps=1μs,閾值門限MinPts=6length(Arr)/max(Arr),采用該參數(shù)進行噪聲剔除可得聚類結果如圖3所示。
圖3 第一輪聚類PRI值分布圖
通過圖3可得,第一輪中需要被提取的PRI值為187μs。將PRI=187μs所包含的到達時間序列通過后文2.2節(jié)曲線擬合進行提取之后,繼續(xù)重復該聚類算法可得圖4和圖5。
圖4 第二輪聚類PRI值分布圖
如圖3~圖5所示,在不同PRI值序列的提取過程中,選取數(shù)據點分布最多的類對應的均值作為PRI估計值,該PRI值必然周期較短,且對應的脈沖序列出現(xiàn)的頻率較高,因此可以將個數(shù)最多的脈沖序列從混疊時間序列中提取出來,從而降低原始脈沖流密度。再對剩余的時間脈沖序列重復上述PRI估計和提取的過程,每次只提取一組脈沖序列,直到沒有足夠的脈沖點可供分選。即完成了對混疊序列的PRI值估計。
PRI曲線擬合的算法原理是:如果一個理想的雷達脈沖信號具有恒定的脈沖重復周期(PRI),那么各脈沖的到達時間(TOA)與脈沖到達序號(基準脈沖間隔的PRI個數(shù))間呈現(xiàn)一維線性關系。設橫坐標x為雷達各脈沖序號,縱坐標y為雷達脈沖的到達時間,對應直線方程為
y=kx+b
(6)
其中斜率k代表雷達信號的脈沖重復周期,截距b則代表初始脈沖的到達時間。
傳統(tǒng)的曲線擬合算法(LMS)依據的原理是點到直線的距離是否滿足最小容差,但運算量非常大,不利于進行實時處理。改進型的PRI曲線擬合依據的原理是:通過斜率值PRI和截距值到達時間(toa)初始值,來預估第i個到達時間理論值,并判斷其與實際TOA的差值是否滿足最小容差,具體方法如式(7)所示。
假設某雷達第i個脈沖的到達時間為TOAi,則
TOAi-TOA0=i×(PRI+?t/i)
(7)
因此
(8)
假設已經求出了前i-1個脈沖對應PRI的期望值,則第前i個脈沖PRI的期望值通過式(9)計算得
(9)
本文所采取算法與傳統(tǒng)曲線擬合公式不同,加大了新元素的擬合占比,仿真實驗驗證,分選正確率更高。同理,假設已求出了第i個脈沖以前的曲線擬合截距b,則第i+1個脈沖b的期望值方法采用如式(10)、式(11)方式計算:
b′i=TOAi-PRIi×i
(10)
(11)
改進LMS算法不僅在性能上與經典的LMS算法相差無幾,而且在時間上比經典的LMS算法省去將近1/3的時間,使整個系統(tǒng)具有更好的實時性,降低計算單元的負擔。
基于曲線擬合的PRI搜索算法,基本原理是確定一個初始到達時間,也稱為基準脈沖,根據潛在的PRI值進行序列搜索,若搜索得到的脈沖數(shù)超過既定門限,則可匹配找到該值對應的到達時間序列值,本文中具體步驟如下:
1)步驟1:根據DBSCAN算法得出潛在PRI值。
2)步驟2:以初始到達時間為基準,計算下一個相鄰脈沖與基準值的一級差值作為可能的PRI值,判斷其與真實PRI的差值是否在誤差允許范圍內,若滿足條件,則繼續(xù)通過該值進行搜索;若不滿足條件,則以下一個相鄰脈沖為基準,繼續(xù)計算判斷。
3)步驟3:若通過步驟2搜索到的脈沖數(shù)目大于8個,則認為潛在的PRI值為真實的PRI值,按照該PRI值進行曲線擬合。否則計算第三個脈沖與基準的二級差,繼續(xù)重復上述判斷,直到可能的PRI值不在真實PRI值的誤差允許范圍內,基準脈沖換為下一個相鄰脈沖。
4)步驟4:重復步驟2、步驟3,直到無法找到滿足條件的基準脈沖或剩余脈沖數(shù)目不足。
如圖6所示,是經過第一輪PRI抽取的到達時間序列圖,圓圈標注的采樣點即為從原始混疊到達時間序列中和當前PRI匹配的TOA值;圖7是對抽取出的TOA序列值進行曲線擬合的結果,可以得出其符合相應的一維線性關系。
圖6 第一輪抽取到達時間(TOA)序列圖
圖7 曲線擬合到達時間序列圖
為了對照本文所提出的基于DBSCAN聚類和PRI曲線擬合的PRI分選算法和經典SDIF分選算法之間的性能差異,采取單一變量對照試驗,分別對不同待分選信號個數(shù)、不同噪聲系數(shù)下兩種分選算法的分選正確率進行統(tǒng)計,蒙特卡洛循環(huán)次數(shù)均為1000次,對照試驗條件如下:
1)仿真實驗1:
待分選信號源個數(shù)radarNum=2, radarNum=3,radarNum=4,脈沖重復周期值分別為:①PRI1=187、PRI2=230;②PRI1=187、PRI2=230、PRI3=300;③PRI1=187、PRI2=230、PRI3=300、PRI4=410;到達時間噪聲為均勻噪聲,噪聲水平為20%,正確率對照試驗結果如表1所示。
表1 不同信號源個數(shù)條件下兩算法分選性能對照表
結論:由實驗對照表1可以看出,在固定噪聲水平、不同信號源個數(shù)的條件下,DBSCAN聚類加曲線擬合的方法的分選正確率優(yōu)于基于統(tǒng)計直方圖的SDIF算法,在多信號(四信號源)條件下更為明顯,說明文中所提辦法對復雜多信號環(huán)境的適應性更強。
2)仿真對照實驗2:
待分選信號源個數(shù)radarNum=3脈沖重復周期值分別為:PRI1=187、PRI2=230、PRI3=300,到達時間噪聲為均勻噪聲,噪聲水平為①10%;②15%;③20%;④25%;⑤30%;正確率對照試驗結果如表2所示。
表2 不同噪聲水平條件下兩算法分選性能對照表
為了更加直觀地體現(xiàn)出噪聲水平對兩種分選算法的影響程度,在3個信號源個數(shù)條件下,取噪聲系數(shù)為因變量,變化范圍從10%~40%,以1%為步進仿真對照兩種分選算法的正確率。仿真結果如圖8所示。
圖8 三信號源條件下兩種分選算法性能對照圖
結論:由實驗對照表和結果仿真圖8可得,在相同3個待分選信號源條件下,當噪聲水平大于15%時,DBSCAN聚類加曲線擬合的方法的分選正確率比SDIF算法高1.5%~14%不等,噪聲水平在35%以內時,本文提出的方法分選正確率均能保持在95%以上,而SDIF若需保持相同分選正確率,噪聲水平需不超過21%,證明相比之下,DBSCAN聚類加曲線擬合方法的抗噪性能更佳。
3)仿真對照實驗3:
待分選信號源個數(shù)radarNum=2脈沖重復周期值分別為:PRI1=187、PRI2=230、到達時間噪聲為均勻噪聲,取噪聲系數(shù)為因變量,變化范圍從10%~40%,以1%為步進仿真對照兩種分選算法的正確率。仿真結果如圖9所示。
圖9 兩信號源條件下兩種分選算法性能對照圖
結論:由實驗對照表和結果仿真圖9可得,在相同2個待分選信號源條件下,當噪聲水平大于15%時,DBSCAN聚類加曲線擬合的方法的分選正確率比SDIF算法高0.9%~13%不等,噪聲水平在36%以內時,本文提出的方法分選正確率均能保持在95%以上,而SDIF若需保持相同分選正確率,噪聲水平需不超過24%,證明相比之下,DBSCAN聚類加曲線擬合方法的抗噪性能更佳。
由仿真對照實驗1可知,在4個信號源條件下,經典SDIF算法正確率有明顯下滑,故此處不再對照該種條件下噪聲水平變化對兩種算法的影響。
針對傳統(tǒng)SDIF算法在PRI分選處理中表現(xiàn)出明顯的抗噪性能和抗諧波性能較差的問題,本文對基于密度的聚類算法進行了研究,提出了將DBSCAN聚類與曲線擬合相結合的PRI分選算法,首先通過DBSCAN聚類算法對噪聲點的高敏感度,以及在分選處理中所表現(xiàn)出的良好抗諧波性能,提高正確識別PRI值的概率,從而為后續(xù)有效的序列抽取提供了基礎。同時,由于信號到達時間序列所呈現(xiàn)出的線性關系,采用曲線擬合算法可以準確地從混疊脈沖序列中的提取出不同PRI值所對應的TOA序列。文中使用的DBSCAN算法可根據實際工程需求對鄰域半徑和核心樣本點值等參數(shù)進行調整及優(yōu)化。最后通過仿真驗證了該方法的有效性,并和傳統(tǒng)的SDIF算法在不同的分選效能方面進行對比,進一步說明了本文提出的PRI分選算法具有更高的正確識別概率。