朱 峰,蔣倩倩,林 川,楊 嘯
(西南交通大學電氣工程學院,四川 成都 611756)
隨著軌道交通和無線電通信的快速發(fā)展,民航周圍電磁環(huán)境變得更加復雜,有限的頻率資源越來越擁擠,電磁干擾現(xiàn)象也越來越嚴重,對民航甚高頻通信產(chǎn)生重大影響[1-2]。
根據(jù)干擾信號的頻譜特性,一般可分為窄帶干擾和寬帶干擾兩類。窄帶干擾的頻譜具有穩(wěn)定的峰值特性,易于識別,目前對其排查的技術(shù)已經(jīng)很成熟,如黑廣播[3]。然而,排查中最主要的問題是寬帶干擾,其出現(xiàn)沒有任何規(guī)律,且隨機性較強,這給排查帶來了盲目性,如高速列車通過電分相或由于長時間工作的老化燈泡[4-7]。此外,由于通信技術(shù)的發(fā)展,全球定位系統(tǒng)(global positioning system,GPS)干擾器的廣泛使用也構(gòu)成了潛在的威脅[8-9]。由于設(shè)備的缺乏和數(shù)據(jù)不完備,這類干擾一旦出現(xiàn),通過定位技術(shù)并不能得到干擾源的具體位置,而是某個確定的區(qū)域內(nèi),此時若想要消除干擾信號,就需要結(jié)合人工排查,對該區(qū)域內(nèi)所有可能造成干擾的電氣設(shè)備逐一進行排查,效率很低。因此,為保障民航機場的安全運行及通信,及時發(fā)現(xiàn)干擾機場通導設(shè)備的電磁干擾源并采取相應(yīng)的措施,以便在排查干擾信號時有針對性地對限定區(qū)域內(nèi)的某類電氣設(shè)備進行快速查找,提高民航機場的運行安全?;谶@一問題,利用數(shù)據(jù)庫對各種干擾源的頻譜數(shù)據(jù)進行存儲和管理,通過對干擾源的特征提取進行寬帶電磁干擾源的識別分析。
目前,針對民航機場附近的干擾源而言,由于不明確其干擾特性,使得排查效率低且具有盲目性。在現(xiàn)有文獻中,對機場附近的干擾源識別研究較少,只有某些高校和研究所開展了一定的研究,其中西安電子科技大學的黃孟龍和劉君華[10-11]采用相似度來判別電磁兼容系統(tǒng)中的干擾源類型。然而,在大數(shù)據(jù)時代,這種方法較為局限,找到一種便捷的干擾識別方法再加以排查就顯得尤為重要,這就需要提到機器學習。近年來,高效便捷的機器學習在識別領(lǐng)域得到了廣泛應(yīng)用,尤其是語音識別和故障診斷,其中支持向量機(support vector machine,SVM)對小樣本系統(tǒng)具有獨特的優(yōu)勢。文獻[12]研究了機器學習中的隨機森林法和SVM。通過對Sentinel-2時間序列數(shù)據(jù)提取特征進行農(nóng)作物的識別,將機器學習算法和傳統(tǒng)的分類方法進行比較分析,明確機器學習算法在多分類問題中,識別性能明顯優(yōu)于傳統(tǒng)分類方法,且樣本的不均勻分布也不會影響其識別精度。文獻[13]基于民航使用飛機通信尋址和報告系統(tǒng)(aircraft communication addressing and reporting system,ACARS)生成的數(shù)據(jù)具有簡單實時的優(yōu)點,對該數(shù)據(jù)分析,利用粒子群優(yōu)化的SVM對飛機危險性識別,有較高的識別速度和精度。文獻[14]結(jié)合模糊C均值聚類方法獲得的訓練集,用SVM對航天器電氣特性進行識別,結(jié)果表明該方法與傳統(tǒng)方法相比有更高的精度。SVM在航空中也用于故障識別和雷達信號識別[15-16]。雖然SVM在這些方面具有良好的可靠性和魯棒性,但在民航電磁干擾識別中較罕見。
為保持機組人員與地面管制人員之間的通信暢通,本文提出一種基于SVM的典型寬帶干擾識別方法。結(jié)合干擾源的頻譜數(shù)據(jù)分析信號特性,提取寬帶干擾的特征向量需通過主成分分析(principal component analysis,PCA)法對其進行數(shù)據(jù)降維處理,然后利用SVM識別文中展示的6種典型寬帶干擾。
在民航電磁干擾相關(guān)問題的測試和分析,以及大多數(shù)標準中涉及到設(shè)備的技術(shù)指標時,基本都是在頻域中規(guī)定的,如標準無線電干擾和抗擾度測量裝置和方法規(guī)范。
如GB6364所述,航空業(yè)務(wù)中的干擾難題主要是非航源,其來源多且分布廣泛,如廣播業(yè)務(wù)、電氣化鐵路、家用電子設(shè)備老化等。由于民航機場處于運營階段,受測試條件的局限性,本文只針對小部分干擾源進行了分析研究,包括列車電分相、GPS干擾器和老化燈泡,其中列車電分相在四川省成都市成南線進行測量,其余干擾源均在學校實驗室中進行頻譜測量。老化燈泡包括多種民用照明燈泡、機場照明燈泡和機場跑道燈泡,經(jīng)過多次測試發(fā)現(xiàn)少數(shù)老化燈泡確實存在干擾現(xiàn)象。根據(jù)實測結(jié)果,從3類老化燈泡中各選擇一個存在干擾現(xiàn)象的燈泡,同列車電分相和兩類干擾器共同組成6類最終的識別干擾源。列車電分相的測試場景及其余干擾源的實物如圖1所示,老化燈泡的參數(shù)如表1所示。
圖1 電磁干擾源測試場景及對象Fig.1 Test scene and object of electromagnetic interference source
表1 老化燈泡的參數(shù)指標Table 1 Parameter indexes of aging bulb
根據(jù)測試要求,采用頻譜儀對上述干擾源進行掃頻測試,已知民航無線電頻率的分布很廣,若將頻譜儀的掃描寬度覆蓋整個頻帶,不僅造成掃描時間過長,同時也不利于分析干擾信號的特性。基于該問題,考慮到機場無線電導航臺的工作頻率和通信問題的影響,頻譜儀的起始頻率和終止頻率分別設(shè)為108 MHz、350 MHz,選用峰值檢波,分辨率帶寬設(shè)為120 kHz。測試儀器及技術(shù)指標如表2所示。
表2 測試設(shè)備及技術(shù)指標Table 2 Testing equipment and technical index
測試數(shù)據(jù)為測試頻段內(nèi)對應(yīng)的電壓幅值,頻譜圖由峰值保持(藍線)和實時刷新值(黑線)共同組成。電分相處是在外場進行干擾測試,周圍存在許多不確定性因素,引起周圍電磁環(huán)境改變,從而造成各個時刻下的背景信號不一致,其背景測試如圖2所示。
圖2 不同時刻電分相的背景測試Fig.2 Background test of neutral section at different time
除電分相外,其余5類干擾源是在實驗室里進行測試,周圍電磁環(huán)境變化相對較小,背景信號基本一致,存在較小的涌動性,背景測試如圖3所示。根據(jù)測試數(shù)據(jù)分析,電分相處的干擾測試具有很強的隨機性,且列車經(jīng)過電分相時電磁輻射強度大,其頻譜測試如圖4所示。與背景測試圖2相比,可以明顯看出當列車經(jīng)過電分相時,干擾信號的電平整體抬升,且隨著頻率的升高,輻射強度逐漸降低。
圖3 實驗室的背景測試Fig.3 Laboratory background test
圖4 電分相典型頻譜測試Fig.4 Typical spectrum test for neutral section
干擾器只能在規(guī)定區(qū)域內(nèi)使用,并且使用前需上報有關(guān)部門,經(jīng)允許后才能使用,但是由于干擾器體積小、便于攜帶,很容易將其帶入機場或者放于機場附近,這些都是較難被發(fā)現(xiàn)的,一旦干擾器的信號落入通導設(shè)備的工作頻段內(nèi),將會阻斷通信設(shè)備與外界基站的聯(lián)系,從而影響機場的正常通信。干擾器主要表現(xiàn)為同頻干擾,其輻射強度較大,具有一定涌動性,兩類不同GPS干擾器的頻譜測試如圖5所示。
圖5 干擾器的頻譜測試Fig.5 Spectrum test for jammer
相較電分相和干擾器而言,老化燈泡的輻射強度相對較小。對于所選的3種存在干擾的老化燈泡,其頻譜特征主要表現(xiàn)在兩個方面:一方面是干擾信號連續(xù)存在,且隨著頻率的升高,輻射強度逐漸降低;另一方面干擾信號連續(xù)存在,且明顯觀察到在某個頻段存在包絡(luò)特征。民用照明、機場跑道和機場照明3類老化燈泡的頻譜測試分別如圖6(a)~圖6(c)所示。
圖6 老化燈泡的典型頻譜測試Fig.6 Typical spectrum test for aging bulb
干擾特征的提取往往決定著識別效果的好壞。特征提取的越好,特征向量中包含的有用信息越多,分類效果也越好。因此,特征提取在識別中有著重要作用。頻譜測試中,由于測試場地的限制,每類干擾源測試20組樣本,每組測試數(shù)據(jù)點為1 001,為了避免在特征提取時發(fā)生頻率偏移,保證特征數(shù)量的統(tǒng)一,將頻譜數(shù)據(jù)進行分段處理,依次進行干擾源的特征提取[17]。
包絡(luò)特征指測試頻率段內(nèi),頻譜信號在一個或若干個小的頻率段內(nèi)連續(xù)存在,且在該頻段內(nèi)的中心頻率點處輻射強度最大,左、右兩側(cè)的輻射強度呈現(xiàn)為單調(diào)遞增和單調(diào)遞減,則將其認為是包絡(luò)信號[18]。列車電分相、干擾器以及各類老化燈泡并非都存在包絡(luò)信號,再者不同干擾源類型即使存在包絡(luò)信號,其信號的頻率段和輻射強度均不同;并且包絡(luò)特征的提取是一個或者若干個小范圍的頻率段,其特征數(shù)量龐大,編程困難,導致識別特征向量的維數(shù)不一致,不利于干擾源的識別?;谏鲜鲈?先對干擾信號進行包絡(luò)處理,再對劃分的每個頻段計算包絡(luò)因子[11],用包絡(luò)因子來表征干擾源的包絡(luò)特征,有利于簡化編程,保障特征向量維數(shù)的統(tǒng)一,計算公式如下:
(1)
為分析信號的波動情況,提取各頻段干擾信號的能量特征[19]。通常情況下,更多的可能是針對時域來描述能量特征,由于能量守恒,所以信號通過時域和頻域計算得到的能量是相同的。針對頻譜測試,在頻域中直接采用相對能量來表征電磁干擾的能量特征,即每個頻段的能量占干擾信號總能量的百分數(shù)比。
某段信號的能量常用其幅值的平方或包絡(luò)面積等參數(shù)來表示,則第k段的能量為
(2)
信號的總能量為
E=E1+E2+…+Ek
(3)
相對能量為
(4)
峰值信號是判斷電磁干擾類別的重要信號。由于頻譜儀測試的干擾信號中含有一定的白噪聲,其在一定范圍內(nèi)隨機波動,與背景信號有關(guān),所以峰值特征并不能簡單地由單調(diào)性確定。目前,峰值特征的提取方法很多[20-21],其中比較典型的一種是搜索背景信號中的最大值,再加上一固定值作為峰值特征的閾值,大于該值則提取為峰值信號,該方法提取的特征數(shù)量越大,有用信號越多。由于進行了分段處理,用該方法提取峰值特征會增加計算量,同時不同干擾源之間的峰值特征差異也較大,不利于后續(xù)識別,從而選擇每個頻段的最大值作為干擾源的峰值特征。峰值特征的表達式為
F3(k)=max{xk(n)},n=1,2,…,N
(5)
由于采用了信號分段處理,若僅提取包絡(luò)、能量和峰值特征,特征數(shù)量少,干擾特征的代表性較弱。為了更準確地識別再提取均值和方差兩個統(tǒng)計特征[22],均值和方差的計算公式分別如下:
(6)
(7)
特征向量間要求有相同的度量,需對每一特征向量進行歸一化處理。設(shè)任意特征向量為Fj=[f1,f2,…,fk],對其進行歸一化處理,計算公式如下:
(8)
式中:Fjk表示第j類特征向量中第k個特征進行歸一化處理;fk為原始特征;fmax和fmin分別為該組特征向量中的最大值和最小值。則經(jīng)歸一化后的某一類初始特征向量為
(9)
PCA是一種簡化數(shù)據(jù)集技術(shù),常用于數(shù)據(jù)集的降維處理,同時保持數(shù)據(jù)集中方差貢獻最大的特征[23-27]。原始特征的矩陣維度越高,不同特征之間的相關(guān)性可能也越強,就會存在特征冗余的問題。若直接輸入到SVM中進行識別,不僅會增加訓練時間,降低分類效果,而且當數(shù)據(jù)維度大于樣本數(shù)目時,易造成過度擬合的問題,進而影響識別精度?;谠搯栴},對初始特征向量進行降維處理,不僅降低了數(shù)據(jù)間的冗余程度,也提高了系統(tǒng)的運行效率,從而提高干擾源的識別正確率。設(shè)原始特征為Fa×b,降維后的特征向量為Fa×c(c
步驟 1計算數(shù)據(jù)中心化F′。
(10)
步驟 2計算協(xié)方差矩陣Cx。
(11)
步驟 3計算協(xié)方差的特征值λi和特征向量vi。
(12)
式中:Λ為vi對應(yīng)下標特征向量的特征值組成的對角陣。
Λ=[λ1,λ2,…,λn]
步驟 4將特征向量按照特征值降序排列,選擇前c個主要特征向量構(gòu)成特征矩陣P。
步驟 5計算降維后的數(shù)據(jù)Z。
Z=F′×P
(13)
在PCA降維處理過程中,特征向量的個數(shù)有兩種選定方法:一是人工直接選擇特征向量的個數(shù);二是由主成分的貢獻率來確定特征向量的個數(shù)。由于不確定到底應(yīng)該選多少個特征才能有更好的識別效果,所以選擇后者來確定特征向量的個數(shù),文中選擇主成分的總貢獻率達90%的特征向量組成識別特征向量。仿真結(jié)果如圖7所示。
圖7 PCA貢獻率Fig.7 PCA contribution rate
針對文中所選的6類寬帶干擾源,首先將測試的頻譜數(shù)據(jù)進行分段處理,為保證干擾源的特性,此處將整個測試頻段分成10個頻率段;再依次提取干擾源的包絡(luò)、能量、峰值、均值和方差5類干擾特征,經(jīng)過特征提取后形成了一個50維的初始特征向量。結(jié)合圖7可以看出,初始特征向量經(jīng)PCA數(shù)據(jù)降維處理后,前8個主成分的總貢獻率就已經(jīng)達到了90%。因此,選擇貢獻率最大的前8個主成分對應(yīng)的向量組成最終的識別特征向量,用較少數(shù)量的特征最大限度地保留了干擾源更多的有用信息,既提高了系統(tǒng)的運行速度,也提升了識別的準確率。
干擾源經(jīng)各個干擾特征提取后,形成了一個高維的初始特征向量,從圖7可以看出,PCA數(shù)據(jù)降維處理后,前8個主成分的總貢獻率達到了90%,用較少數(shù)量的特征最大限度地保留了更多的有用信息。因此,選擇貢獻率最大的前8個主成分對應(yīng)的向量組成識別特征向量,提高了系統(tǒng)的運行速度和識別準確率。
SVM是20世紀90年代提出的一種基于統(tǒng)計學理論的機器學習方法,以結(jié)構(gòu)風險最小化原則為理論基礎(chǔ),對解決小樣本、高維數(shù)、非線性等問題都有明顯的優(yōu)勢。該方法最初是針對線性二分類問題提出的,但實際情況中,更多的是對非線性、多分類問題的研究,其構(gòu)造多分類器的方法主要有兩種,一是直接修改目標函數(shù),將多個分類面的參數(shù)求解綜合到一個最優(yōu)化問題中進行求解,計算復雜不易實現(xiàn);二是通過多個二分類器的組合來實現(xiàn)目標的多分類[28-32]。SVM在識別領(lǐng)域的應(yīng)用已經(jīng)相對比較成熟,其基本原理是利用非線性變換將線性不可分空間映射到高維線性可分空間,并建立一個VC(Vapnik-Chervonenkis)維的分類器,該分類器僅由樣本中少量的支持向量確定,具有最大的分類間隔。
本次仿真實驗在Matlab R2018b軟件平臺上,利用工具箱Libsvm構(gòu)建多個二分類器,實現(xiàn)民航機場周圍典型的6類寬帶干擾源識別。SVM進行識別時,核函數(shù)選擇為徑向基函數(shù),采用交叉驗證法進行網(wǎng)格搜索,尋找最優(yōu)的懲罰因子系數(shù)和參數(shù)系數(shù)。針對6類典型寬帶干擾進行數(shù)據(jù)采集,每類干擾源均采集20組樣本數(shù)據(jù),任選10組樣本組成訓練集,剩余10組構(gòu)成測試集。經(jīng)包絡(luò)因子、頻譜峰值、頻譜能量、均值和方差5種干擾特征的提取后,產(chǎn)生初始特征向量矩陣(120×50),PCA降維后形成識別特征向量(120×8)。利用兩種情況來進行SVM識別分析,第一種情況:初始特征向量直接作為SVM的輸入向量,主要存在特征冗余的問題,造成識別準確率低,識別結(jié)果如圖8(a)所示;第二種情況:PCA降維后的識別特征向量作為SVM的輸入向量,與前者相比,表明PCA降維處理有助于提高干擾源的識別率,仿真結(jié)果如圖8(b)所示。圖8干擾源的SVM仿真識別中,類別編號1~6依次代表民用照明燈泡、機場照明燈泡、機場跑道燈泡、GPS干擾器(2線和6線)和電分相。
圖8 SVM的仿真結(jié)果Fig.8 Simulation result of SVM
從圖8可以看出,當初始特征向量直接作為SVM的輸入向量時,干擾源的識別率為95%,而SVM的輸入是PCA降維后的識別特征向量時,識別的準確率達到了98.33%,與不降維處理相比,識別率明顯增加。圖8(b)中可以明顯看到,6類民航典型寬帶干擾中有5類干擾源的識別率達到了100%,只有類別2被錯誤地識別為類別6,主要原因可能是類別6在采集數(shù)據(jù)時,其背景信號波動大,干擾信號隨機性強。
本文針對民航電磁干擾提出了一種基于SVM的寬帶干擾識別方法。利用采集到的頻譜數(shù)據(jù),分析信號的特性并提取干擾特征,分析特征向量是否經(jīng)過PCA降維處理的識別率差異。實驗結(jié)果表明,SVM能有效識別6類典型寬帶干擾,并且經(jīng)PCA處理后的識別效果更好。因此,當民航機場存在干擾時,可以先直接通過計算機系統(tǒng)實現(xiàn)干擾源的判別,再帶有目的性地去排查,這樣既經(jīng)濟又高效。同時,本文也存在測試樣本少、特征提取泛化等問題,這將是下一步的研究工作。