楊亮亮
(中國(guó)西南電子技術(shù)研究所,成都 610036)
隨著無(wú)線電技術(shù)的快速發(fā)展,現(xiàn)代戰(zhàn)場(chǎng)中的通信電子設(shè)備規(guī)模和數(shù)量不斷增長(zhǎng),對(duì)通信電臺(tái)實(shí)現(xiàn)精準(zhǔn)分選與識(shí)別已成為電子偵察對(duì)抗領(lǐng)域的研究熱點(diǎn),但也是難點(diǎn)。電臺(tái)的分選能夠快速分析兵力規(guī)模及部署,個(gè)體識(shí)別可以有效判別目標(biāo),對(duì)掌握戰(zhàn)場(chǎng)態(tài)勢(shì)具有很大的支撐作用,而傳統(tǒng)只針對(duì)信號(hào)層面的分析識(shí)別顯然已不能完全滿足需求。
通信電臺(tái)不同于雷達(dá)系統(tǒng),通信類設(shè)備技術(shù)參數(shù)差異小,尤其是同型號(hào)電臺(tái)進(jìn)行組網(wǎng)后,很難從同頻帶、同帶寬、同調(diào)制的非協(xié)同信號(hào)中分離出個(gè)體。另外,隨著復(fù)雜加密技術(shù)的廣泛應(yīng)用,非授權(quán)的接收方在沒(méi)有密匙的條件下也很難解析出在線電臺(tái)的組網(wǎng)信息。
但是電臺(tái)自身固有的一些特征與其他不同個(gè)體之間存在差異,為分選識(shí)別提供了依據(jù)。研究人員從不同的角度提出了不同的特征提取方法。從信號(hào)參數(shù)角度出發(fā),有時(shí)頻域參數(shù)特征(短時(shí)傅里葉變換[1])、高階矩高階譜參數(shù)特征(積分雙譜特征[2])等。從變換域角度出發(fā),有小波分析方法[3]、EMD變換(也稱為HHT)[4]等。但由于各自產(chǎn)生機(jī)理不同,很多特征不具備普適性。
另外,很多先進(jìn)的機(jī)器學(xué)習(xí)算法也被應(yīng)用到了輻射源的分選識(shí)別中,有基于最鄰近距離分類器[5]的識(shí)別方法,有基于貝葉斯分類器[6]、神經(jīng)網(wǎng)絡(luò)分類器[7]的輻射源指紋特征識(shí)別,有基于支持向量機(jī)(Support Vector Machine,SVM)的雷達(dá)輻射源識(shí)別[8]等。上述均為有監(jiān)督或半監(jiān)督的學(xué)習(xí)算法,需要事先提供已知正確的數(shù)據(jù)信息集進(jìn)行訓(xùn)練,在訓(xùn)練的基礎(chǔ)上進(jìn)行分選識(shí)別。而在實(shí)際應(yīng)用中,很多場(chǎng)景是針對(duì)未知輻射源的,并沒(méi)有足夠的先驗(yàn)知識(shí)。
綜上,本文從電臺(tái)物理層面出發(fā),針對(duì)其輻射信號(hào)的雜散、暫態(tài)細(xì)微特征,提出采用基于K-means聚類算法的技術(shù),能夠在沒(méi)有先驗(yàn)知識(shí)的條件下對(duì)未知信號(hào)進(jìn)行高效分選識(shí)別。
電臺(tái)發(fā)射機(jī)的模擬部分一般由數(shù)模轉(zhuǎn)換器(Digital-to-Analog Converter,DAC)、放大器、濾波器、混頻器、射頻功放等器件級(jí)聯(lián)組成,相比數(shù)字電路,模擬器件的細(xì)微差異更明顯也更易提取。
DAC會(huì)引入量化誤差和取整非線性誤差。量化誤差具有均勻分布的性質(zhì),不會(huì)有太大特征差異。取整非線性誤差則會(huì)帶來(lái)實(shí)際步進(jìn)值與理想步進(jìn)值的差異,從而引入非線性失真,從頻域觀察為不同程度的諧波形式,不同器件的諧波失真會(huì)有所差異;中頻本振、射頻本振等頻率源器件受相位噪聲影響,會(huì)體現(xiàn)一定非線性特征,從頻域觀察不再是單一譜線,這些相噪?yún)⑴c混頻、調(diào)制等非線性處理后,會(huì)引入更為復(fù)雜的諧波形式;功率放大器同樣具有非線性特性,理想的放大器輸出端的信號(hào)比輸入信號(hào)大且形狀與輸入信號(hào)完全一樣,但現(xiàn)實(shí)不同的放大器件傳輸曲線不能保證完全相同的線性特性,尤其在鄰近放大器飽和區(qū)域,為了提高放大器的工作效率,輸出功率范圍一般都會(huì)達(dá)到P1 dB壓縮點(diǎn),不同放大器器件線性區(qū)的差異以及壓縮點(diǎn)的不同均會(huì)使得輸出信號(hào)產(chǎn)生非線性的畸變失真,從而擴(kuò)展信號(hào)頻譜,出現(xiàn)雜散。
綜上,不同的電臺(tái)個(gè)體,即使同型號(hào)、同批次產(chǎn)品,由于內(nèi)部各級(jí)物理元器件特性以及工藝差異性等影響,使得其輻射信號(hào)除主成分外會(huì)有噪聲以及一定的雜散分量,這些雜散特性由電臺(tái)個(gè)體本身的物理屬性決定,相互之間具有一定的細(xì)微差異。
圖1(a)為某型電臺(tái)能量歸一化后一段時(shí)域波形圖,時(shí)域放大可以觀察到噪聲與諧波雜散波形的存在。圖1(b)為某型同一批次三部電臺(tái)進(jìn)行無(wú)線通信時(shí),用同一接收系統(tǒng)多次接收采集后的能量譜圖,可以看到不同電臺(tái)輻射信號(hào)在不同頻點(diǎn)的雜散特性相互之間略有差異,而自身卻相對(duì)穩(wěn)定。
(a)時(shí)域
在電臺(tái)狀態(tài)切換時(shí),尤其是發(fā)射能量的加載及釋放的過(guò)度過(guò)程中,由于內(nèi)部電源及元器件差異,使得不同電臺(tái)輻射信號(hào)之間也存在相應(yīng)暫態(tài)特性的差異。雖然隨著使用時(shí)間增加元器件老化等影響使得這些特性有所變化,但短時(shí)間內(nèi)該特性相對(duì)比較穩(wěn)定,也可作為細(xì)微特征進(jìn)行提取使用。圖2(a)為電臺(tái)通信啟動(dòng)時(shí)的能量前沿瞬時(shí)時(shí)域波形,啟動(dòng)過(guò)程為一個(gè)階躍振蕩過(guò)程,其中沒(méi)有夾雜任何調(diào)制,只包含個(gè)體自身特征信息。圖2(b)為某型同一批次的三部電臺(tái)分別進(jìn)行多次無(wú)線通信啟停,用相同接收系統(tǒng)進(jìn)行接收采集后,對(duì)啟動(dòng)過(guò)程的能量前沿波形的譜圖分析,可以看到不同的電臺(tái)啟動(dòng)過(guò)程的頻譜能量分布略有差異,而本身相對(duì)穩(wěn)定。
(a)時(shí)域
與分類不同,聚類沒(méi)有任何先驗(yàn)知識(shí)作為依據(jù),其目的就是要從沒(méi)有標(biāo)記的樣本集中提取其內(nèi)部性質(zhì)和規(guī)律。聚類算法作為無(wú)監(jiān)督學(xué)習(xí)的核心問(wèn)題,在機(jī)器學(xué)習(xí)領(lǐng)域被廣泛研究[9-11]。
K-means是一種從劃分角度[12]出發(fā)的聚類算法,對(duì)大樣本數(shù)據(jù)具有較高效率和良好伸縮性。該算法依據(jù)距離衡量樣本間相似度,距離越近相似度越高,通過(guò)迭代更新方式,不斷降低類內(nèi)樣本跟質(zhì)心的誤差平方和,最終將樣本數(shù)據(jù)聚成K類,K值為提前設(shè)定值。算法具體步驟如下:
Step1 收集樣本集{x1,x2,x3,…,xn},n為總樣本數(shù),每個(gè)樣本向量為xj={xj1,xj2,xj3,…,xjm},xjt為第j個(gè)樣本第t個(gè)屬性,共m維屬性。
Step2 根據(jù)給定K值,選K個(gè)樣本(也可以非樣本點(diǎn))作為初始質(zhì)心,初始質(zhì)心向量集為{a1,a2,a3,…,ak}。
Step3 計(jì)算每一個(gè)樣本點(diǎn)xi到每個(gè)類質(zhì)心向量ak的距離(歐氏距離或余弦距離),歐氏距離為
(1)
依次比較樣本到每個(gè)質(zhì)心的距離大小,將樣本歸為距離最小的類內(nèi),分別為{c1c2c3…ck}類,aj為cj類的質(zhì)心。
Step4 所有樣本歸類后,根據(jù)類內(nèi)樣本更新質(zhì)心位置:
(2)
質(zhì)心即為類內(nèi)所有對(duì)象各個(gè)維度屬性的均值。
Step5 使用更新后的質(zhì)心,重復(fù)Step 3,直到所有質(zhì)心向量收斂,則表示聚類完成。
K-means算法進(jìn)行聚類的前提,是要事先給出確定的類的數(shù)目K值,而實(shí)際應(yīng)用中樣本的類別數(shù)目往往未知,需尋找最優(yōu)K值。通過(guò)對(duì)一定范圍的k(2≤k≤kmax)值進(jìn)行遍歷搜索,用聚類質(zhì)量效果的評(píng)價(jià)指標(biāo)來(lái)選取最優(yōu)值。常用指標(biāo)有CH(Calinski-Harabaz)指標(biāo)、SC(Silhouette Coefficient)指標(biāo)、DB指標(biāo)、Dunn指標(biāo)、I指標(biāo)等?;陔娕_(tái)雜散和暫態(tài)細(xì)微特征分布形式與特點(diǎn),本文分別選取CH和SC兩種指標(biāo)進(jìn)行聚類質(zhì)量評(píng)價(jià)。
CH系數(shù)主要衡量聚類的緊密度和離散度,通過(guò)計(jì)算類內(nèi)協(xié)方差度量類內(nèi)的緊密程度,通過(guò)計(jì)算類間協(xié)方差度量離散度。CH系數(shù)由兩個(gè)協(xié)方差的比值得到,值越大代表類內(nèi)越緊密、類間越分散。
(3)
SC系數(shù)也叫輪廓系數(shù),主要衡量類內(nèi)相似度和類間差異度,通過(guò)計(jì)算樣本與同類中所有其他樣本的平均距離度量類內(nèi)的相似度,通過(guò)計(jì)算樣本與其相近類中的所有樣本的平均距離度量類間的差異度。SC系數(shù)由兩個(gè)平均距離的比值得到,SC值越大代表類內(nèi)越緊密、類間越分散。
(4)
式中:n為總樣本數(shù),a(i)為樣本i與同類內(nèi)其他樣本的平均距離,b(i)為樣本i與非同類的所有樣本的平均距離。
傳統(tǒng)的電臺(tái)分選方法在信號(hào)協(xié)議層面進(jìn)行,在接收無(wú)線電信號(hào)后,進(jìn)行參測(cè)、識(shí)別、解調(diào),然后解碼、解析,從而掌握電臺(tái)個(gè)體信息及其之間的通聯(lián)關(guān)系。但針對(duì)非協(xié)同電臺(tái),往往不具備解析條件。尤其對(duì)于加密電臺(tái),在沒(méi)有密匙的條件下,無(wú)法破解報(bào)文內(nèi)涵,更無(wú)法獲取節(jié)點(diǎn)信息;對(duì)于搶占式、主屬式電臺(tái)通信,沒(méi)有采用網(wǎng)絡(luò)協(xié)議,無(wú)法通過(guò)截獲信號(hào)信息對(duì)在線電臺(tái)進(jìn)行有效分離。
結(jié)合前文,針對(duì)電臺(tái)細(xì)微特征進(jìn)行K-means聚類,以實(shí)現(xiàn)對(duì)電臺(tái)的分選并獲取個(gè)體特征信息。分選步驟如下:
Step1 采集M個(gè)同頻點(diǎn)同調(diào)制在線電臺(tái)樣本值(電臺(tái)數(shù)未知,2~M個(gè))。
Step2 將樣本進(jìn)行歸一化處理后,進(jìn)行時(shí)頻域轉(zhuǎn)換,提取特征值作為參與聚類的樣本向量。
Step3 從K=2開(kāi)始,對(duì)樣本集進(jìn)行K-means聚類。
Step4 計(jì)算當(dāng)前K值聚類的評(píng)價(jià)指數(shù),選取合適的評(píng)價(jià)指數(shù),雜散特性聚類評(píng)價(jià)指數(shù)選擇CH值,暫態(tài)特性聚類評(píng)價(jià)指數(shù)選擇SC值。
Step5 重復(fù)Step 3,直到K=M(或某一個(gè)指定可能最大值Kmax)。
Step6 遍歷所有評(píng)價(jià)指數(shù),尋找最優(yōu)評(píng)價(jià)指數(shù)對(duì)應(yīng)K值,即可視為目標(biāo)電臺(tái)個(gè)數(shù),每個(gè)分類即為各對(duì)應(yīng)電臺(tái)的信號(hào)樣本。
分選流程圖如圖3所示。最優(yōu)K值對(duì)應(yīng)的每個(gè)類的質(zhì)心向量,可作為其對(duì)應(yīng)電臺(tái)個(gè)體的特征屬性值,該特征屬性值可入庫(kù)作為對(duì)新樣本進(jìn)行有監(jiān)督分選和個(gè)體識(shí)別的依據(jù)。
圖3 分選流程圖
經(jīng)過(guò)K-means聚類,一方面將目標(biāo)電臺(tái)進(jìn)行了分選,同時(shí)提取了各個(gè)個(gè)體的特征屬性值。個(gè)體識(shí)別即為新樣本與各個(gè)體特征屬性值之間相似性的判斷,可通過(guò)相關(guān)運(yùn)算來(lái)判斷相似性,相關(guān)值作為相似程度的判據(jù)。相關(guān)運(yùn)算公式如下:
(5)
其中特征屬性值a=[a1,a2,a2,…,am],樣本特征值x=[x1,x2,x2,…,xm]。相關(guān)值越大,相似度越高,當(dāng)前信號(hào)樣本判斷為該電臺(tái)個(gè)體輻射的置信度就越高,最大值為1。
實(shí)驗(yàn)選取了三部同型號(hào)、同批次生產(chǎn)的手持式超短波通信電臺(tái),固定選擇60.25 MHz作為發(fā)射中心頻點(diǎn)進(jìn)行組網(wǎng)通信,使用同一個(gè)超短波接收系統(tǒng)對(duì)不同電臺(tái)輻射信號(hào)接收采集。
4.1.1 可行性實(shí)驗(yàn)
采集雜散特征樣本,將所有樣本隨機(jī)排列。假設(shè)未知電臺(tái)數(shù)目的條件下進(jìn)行分選,采用K-means算法進(jìn)行聚類,遍歷不同K值(大樣本情況下,選擇合適最大K值,確保評(píng)價(jià)指數(shù)達(dá)到收斂即可)。
選擇CH值作為評(píng)價(jià)指數(shù),圖4為不同K值聚類后的CH評(píng)價(jià)指數(shù)值,可以看出最優(yōu)指數(shù)對(duì)應(yīng)的K值為3,與實(shí)際電臺(tái)數(shù)目相符。隨著K值增大,評(píng)價(jià)指數(shù)區(qū)域衰減收斂。
圖4 雜散特征CH評(píng)價(jià)指數(shù)
同樣隨機(jī)采集暫態(tài)特性樣本進(jìn)行聚類。由于其暫態(tài)特征分布具有類內(nèi)較發(fā)散、類間距離較近的特點(diǎn),選用輪廓系數(shù)SC作為評(píng)價(jià)指數(shù)。圖5為不同K值聚類對(duì)應(yīng)的SC評(píng)價(jià)指數(shù)值,可以看出最優(yōu)指數(shù)對(duì)應(yīng)的K值為3,與實(shí)際電臺(tái)數(shù)目相符。
圖5 暫態(tài)特征SC評(píng)價(jià)指數(shù)
選取75 kHz、120 kHz、172 kHz三個(gè)頻點(diǎn)的雜散特性觀察分選效果,如圖6所示,每部電臺(tái)的樣本均能被正確分選。
圖6 雜散特征樣本分選結(jié)果
4.1.2 高效性對(duì)比實(shí)驗(yàn)
為驗(yàn)證采用K-means聚類算法進(jìn)行分選的高效性,對(duì)比2.1節(jié)中提到的Linkage、DBSCAN、GMM三種聚類算法進(jìn)行分選的運(yùn)算時(shí)間。
在相同樣本、相同運(yùn)算環(huán)境下,分選用時(shí)的對(duì)比結(jié)果如圖7所示。可以看出,采用其他算法用時(shí)較多,且隨著樣本數(shù)的增加,分選用時(shí)也隨之存在不同程度的增多,而采用K-means聚類算法進(jìn)行分選始終具有較高效率,特別在大樣本的條件下分選效率優(yōu)勢(shì)更為明顯。
圖7 運(yùn)算時(shí)間對(duì)比
K-means聚類后每個(gè)類的質(zhì)心可作為對(duì)應(yīng)電臺(tái)的特征屬性值,可以用來(lái)作為個(gè)體識(shí)別的參考特征向量。從圖8和圖9中可以看出,提取的特征屬性值基本位于樣本中心。
圖8 雜散樣本及特征屬性值
圖9 暫態(tài)樣本及特征屬性值
采集三部電臺(tái)的新樣本,用3.2節(jié)方法進(jìn)行個(gè)體識(shí)別。表1為不同的電臺(tái)新樣本與提取的特征屬性值相關(guān)運(yùn)算的結(jié)果。電臺(tái)樣本與其自身特征屬性的相關(guān)值最高,均達(dá)到93%以上,可有效實(shí)現(xiàn)信號(hào)樣本的個(gè)體識(shí)別。
表1 電臺(tái)識(shí)別相關(guān)系數(shù)表
本文從電臺(tái)物理層面出發(fā)分析了輻射信號(hào)雜散和暫態(tài)細(xì)微特征的產(chǎn)生機(jī)理,并提出了對(duì)其進(jìn)行K-means聚類的電臺(tái)分選識(shí)別技術(shù)。通過(guò)實(shí)驗(yàn)驗(yàn)證,該技術(shù)方法可行、高效,易于工程實(shí)現(xiàn)。后續(xù)工作,一方面針對(duì)通信電臺(tái)研究提取更多其他維度的個(gè)體特征屬性,以提高分選方法的魯棒性和適應(yīng)性;另一方面研究如何將本文所提出的分選識(shí)別方法進(jìn)行改進(jìn),以擴(kuò)展應(yīng)用到其他類型輻射源。