劉麗明,陳正寧,姚 嘯
(解放軍91336部隊(duì),河北 秦皇島 066326)
脈沖描述字(PDW)是雷達(dá)偵察裝備對雷達(dá)信號脈沖測量結(jié)果的數(shù)字化描述,主要包括脈沖到達(dá)時間(TOA)、載頻(RF)、脈寬(PW)、到達(dá)方向(DOA)、脈幅(PA)[1]。在雷達(dá)信號分選時,PDW是最主要的數(shù)據(jù)源。由于雷達(dá)按照一定重復(fù)周期輻射的電磁脈沖在生成、傳輸、接收和處理過程中會不可避免地出現(xiàn)損失,因此,雷達(dá)偵察裝備形成的PDW與實(shí)際輻射信號的PDW之間存在差異,主要表現(xiàn)為PDW“丟失”,所以,在信號分選過程中,允許PDW適度的“丟失”,避免由此引起分選錯誤或者丟批增批[2]。
在完成雷達(dá)信號分選后,通常還有一部分PDW數(shù)據(jù)沒有參與分選,這些雷達(dá)脈沖描述字被認(rèn)為是無法分選出信號或?qū)Ψ诌x無用的而被分選模塊主動丟棄,但是,其中可能包含高威脅雷達(dá)信號的部分信息,如窄波束高轉(zhuǎn)速雷達(dá)、低截獲概率雷達(dá)等[3],因此,必須重視此類數(shù)據(jù),從中挖掘出有價值的、能描述敵方威脅雷達(dá)的有用信息。由于這些數(shù)據(jù)已經(jīng)被具有先驗(yàn)知識的系統(tǒng)認(rèn)為“無用”,原有的分選準(zhǔn)則和方法已經(jīng)無效,這類數(shù)據(jù)可能是“片面”的或“局部”的小數(shù)據(jù),如果提高分選算法的包容性和分辨力,一定程度上可以避免產(chǎn)生“漏警”[4]。
本文提出的方法是對PDW數(shù)據(jù)的進(jìn)一步挖掘,期望發(fā)現(xiàn)不滿足雷達(dá)偵察裝備原有分選準(zhǔn)則而被遺漏的威脅信號。其主要的思想是按照各類雷達(dá)輻射源信號的輻射特征,分析在不同的電磁環(huán)境下的輻射源特征參數(shù)的細(xì)微變化規(guī)律,根據(jù)電子支援措施(ESM)設(shè)備在不同頻段范圍的測量值和參數(shù)測量誤差,采用更加寬泛的統(tǒng)計判別門限,通過DBSCAN算法聚類,使看似“無用”的脈沖在較小的累計數(shù)值下,分選成新的雷達(dá)信號。
PDW數(shù)據(jù)二次處理的目的是尋找“隱藏”在“無用”數(shù)據(jù)中的,來自于同一個雷達(dá)輻射源的一組數(shù)據(jù),聚類就是把相似的東西歸為一類,這一類數(shù)據(jù)在參數(shù)特征上存在明顯區(qū)別,分屬在不同的目標(biāo),因此,可以選擇DBSCAN算法[5]。該算法是一種基于密度的空間聚類方法,利用類的高密度連通性可以快速發(fā)現(xiàn)任意形狀的類[6]。與其它聚類算法的區(qū)別是:基于密度聚類可以發(fā)現(xiàn)任意形狀的簇,對空間數(shù)據(jù)的聚類具有明顯的優(yōu)勢,而基于距離的算法只能發(fā)現(xiàn)“近似于圓形”的簇[7]。
ε鄰域:給定對象半徑ε內(nèi)的區(qū)域稱為該對象的ε鄰域。Pmin定義為最低點(diǎn)數(shù)。
核心對象:對于給定ε、Pmin,如果對象p的ε鄰域包含的對象個數(shù)Nε(p)滿足:
Nε(p)≥Pmin
(1)
則稱p為核心對象。
直接密度可達(dá):對于給定ε、Pmin,當(dāng)p∈Nε(q),且:
Nε(q)≥Pmin
(2)
則稱對象p是從對象q出發(fā)直接密度可達(dá)的。
密度可達(dá):對于給定的對象集合D,如果存在一個對象鏈P1、P2、…、Pn,P1=q、Pn=p,對Pi∈D,(1≤i≤n),Pi+1是從Pi關(guān)于ε和Pmin直接密度可達(dá)的,則稱對象P是從對象q關(guān)于ε和Pmin密度可達(dá)的。
密度相連:如果對象集合D中存在一個對象o,使得對象q、p是從o關(guān)于ε和Pmin密度可達(dá)的,那么對象p和q關(guān)于ε和Pmin密度相連。
簇和噪聲:基于密度可達(dá)性的最大密度相連對象的集合稱為簇,不在簇中的任何對象則稱為噪聲。
DBSCAN算法的主要思想是:對于構(gòu)成簇的每個對象,其鄰域包含的對象個數(shù),必須大于或等于某個給定的值(Pmin),用戶根據(jù)目標(biāo)和實(shí)際情況,預(yù)先設(shè)定ε和Pmin,DBSCAN通過檢查數(shù)據(jù)集中每個點(diǎn)的ε鄰域來尋找聚類。如果一個對象q的ε鄰域包含的對象數(shù)大于或等于Pmin(其它對象到q密度可達(dá)),則稱該對象為核心對象q,同時創(chuàng)建一個以q作為核心對象的新簇,反復(fù)查找從q直接密度可達(dá)的對象并將其加入到該簇,直到?jīng)]有新的點(diǎn)可以被添加;如果一個對象p的ε鄰域包含的對象數(shù)小于Pmin,則沒有對象從p密度可達(dá),點(diǎn)p被暫時標(biāo)注為噪聲點(diǎn),但會參與到其它鄰域的檢查。當(dāng)所有檢查完成后,沒有聚類到任何一個簇中的對象被認(rèn)為是噪聲數(shù)據(jù)點(diǎn),做刪除處理[9]。
通常情況下,經(jīng)過一次分選后,沒有參加后續(xù)分選的PDW數(shù)據(jù)量仍然較大。假設(shè)在20萬脈沖密度/s的情況下(PPS),考慮信號處理過程中高于20%的脈沖丟失,如果有5%的PDW數(shù)據(jù)被丟棄,也會有8 000個PDW數(shù)據(jù)可用于二次分選,另一方面,這些PDW數(shù)據(jù)不具有顯著的規(guī)律性,需要經(jīng)過預(yù)先處理后才能進(jìn)行二次分選,主要工作流程包括數(shù)據(jù)檢查、二次處理和結(jié)果驗(yàn)證3個環(huán)節(jié),如圖1所示。
圖1 PDW數(shù)據(jù)二次分選流程
數(shù)據(jù)檢查是對“無用”的、可能“離散”的PDW數(shù)據(jù)進(jìn)行預(yù)處理,提高參加二次分選的數(shù)據(jù)的質(zhì)量。預(yù)處理主要檢查到達(dá)角、頻率、到達(dá)時間、幅度等值是否超限。一般情況下,這4項(xiàng)不會出現(xiàn)野值。為了減少二次分選的工作量,通過人工干預(yù)的方式設(shè)置處理門限,用戶根據(jù)需求或信息支持,設(shè)定參數(shù)取值范圍,從而過濾掉一部分PDW??梢赃x擇的門限主要包括:頻率范圍、DOA范圍、幅度和脈寬,詳見表1。
二次處理主要包括聚類、分選2個環(huán)節(jié),聚類的
表1 PDW數(shù)據(jù)篩選原則
過程主要完成對PDW的篩選,將同屬于一個輻射源的PDW統(tǒng)一到一個對象集中,分選的過程則是將同一個對象集中的PDW數(shù)據(jù)識別為雷達(dá)信號。
2.3.1 聚類
基于DBSCAN算法,對PDW數(shù)據(jù)處理的基本流程為[10]:
(1) 選定PDW數(shù)據(jù)二次處理集Dpdw;
(2) 設(shè)置初始聚類參數(shù)。在PDW={TOA、RF、PW、DOA、PA}中,選擇一個參數(shù)作為聚類的參數(shù),建議根據(jù)裝備實(shí)際從TOA、RF或PW中優(yōu)選,并設(shè)定ε領(lǐng)域的半徑和Pmin;
(3) 為集合Dpdw中所有的對象進(jìn)行標(biāo)記,為“unvisited”;
(4) DBSCAN從Dpdw中任意選擇一個unvisited對象p,修改標(biāo)記為pv(visited);
(5) 根據(jù)設(shè)定,計算pv的ε鄰域是否至少有Pmin個對象,如果小于Pmin,則將pv標(biāo)記為噪聲點(diǎn)pn,否則,為p創(chuàng)建一個簇C;
(6) 將所有ε鄰域內(nèi)的對象放到候選集合N中;
(7) 用迭代的方法,把N中不屬于其它簇的對象加入C中,邊界點(diǎn)可以指定加入一個簇中;
(8) 在N中任意選取p′,并將其標(biāo)記由“unvisited”改為“visited”,繼續(xù)執(zhí)行(5)~(7)步計算,直到N為空(C無法擴(kuò)展),此時生成并輸出簇C;
(9) 從剩下的對象中任意選擇一個unvisited對象,重復(fù)(4)~(8),直到所有的對象被訪問;
(10) 刪除噪聲點(diǎn),處理完成。
圖2 聚類的基本過程
2.3.2 分選
將所有簇送分選,分選由雷達(dá)偵察裝備的相應(yīng)分機(jī)完成,分選算法需要在一次分選的基礎(chǔ)上進(jìn)行適當(dāng)修正,如將信號建批的最小脈沖數(shù)適當(dāng)變小,將信號重復(fù)周期可接受最大值增大等。
結(jié)果驗(yàn)證需要查詢第1次分選時建立的臨時信號表,與二次分選的結(jié)果對比,判斷2次分選的結(jié)果是否存在“同源性”,即來自同一個雷達(dá)輻射源,如果存在,則做合批處理,如果不存在,則直接輸出。
仿真1組PDW數(shù)據(jù)流,包含1 000批數(shù)據(jù),按脈沖出現(xiàn)時序?qū)︻l率分布進(jìn)行做圖,如圖3所示。
圖3 PDW頻率分布(1 000組)
經(jīng)一次分選后,有169組PDW數(shù)據(jù)被丟棄,其頻率分布如圖4所示。
圖4 信號分選完成后剩余PDW
假定來襲方位在165~171之間,威脅目標(biāo)工作頻段為8~12 GHz,信號幅度碼大于9的脈沖描述字為有效,則采用DBSCAN算法篩選后的結(jié)果如圖5所示。
圖5 經(jīng)數(shù)據(jù)篩選后的PDW
經(jīng)分選處理,信號分選結(jié)果如表2所示。
表2 二次分選結(jié)果表
其中,有一個頻率點(diǎn)10 548由于僅有1個PDW,不滿足分選條件,未輸出分選結(jié)果。
現(xiàn)代戰(zhàn)爭中,采用先進(jìn)技術(shù)體制的雷達(dá)通常具有參數(shù)快變、較低功率、靈活掃描等能力,越來越難以形成足夠數(shù)量、穩(wěn)定的PDW,為雷達(dá)偵察裝備的分選帶來了較大的困難。本文提出的PDW二次分選方法,采用了DBSCAN為核心的算法,其運(yùn)算效率不高,不能應(yīng)用于大量數(shù)據(jù)的處理。因此,通過人工干預(yù)的方式,利用專業(yè)人員的先驗(yàn)知識建立輸入門限,對PDW數(shù)據(jù)進(jìn)行篩選,從而實(shí)現(xiàn)數(shù)據(jù)的再次挖掘,仿真實(shí)驗(yàn)證明,本文提出的方法能夠分選出新的雷達(dá)信號,一定程度上可以減少漏警的概率。本方法可以在以下2個方面進(jìn)行改進(jìn):一是優(yōu)化改進(jìn)DBSCAN算法,提高聚類的效率和準(zhǔn)確性[11];二是建立數(shù)據(jù)檢查環(huán)節(jié)的門限設(shè)置模型,減少人為因素導(dǎo)致的輸入偏差。