丘愷彬,李建良
(南京理工大學 理學院,南京 210094)
無人機技術快速發(fā)展,在環(huán)境監(jiān)測、通訊中繼、大氣取樣及軍事等領域得到廣泛應用,但多地民用機場等凈空保護區(qū)近期隨之不斷出現(xiàn)的“黑飛”事件給低空領域的管理、軍民飛行安全等帶來了極大麻煩。除出臺各種無人機生產銷售管控方法外,快速、有效偵測出無人機的黑飛過程具明確實用意義。目前無人機偵測常用的工具主要有雷達、調頻無線電以及視頻攝像等,國內外已經(jīng)研發(fā)了一些專用裝備,但由于無人機目標小且在低空慢飛行,這些裝備可能受到諸如電子干擾、實物遮擋、盲區(qū)或能見度等影響而具有局限性。
鑒此本文基于被動的音頻采集處理原理,將聲音感知的目標識別技術作為無人機偵測的補充手段。事實上已有文獻報道國外企業(yè)正在開展基于此原理的反無人機商業(yè)開發(fā)。采用聲音感知技術進行無人機偵測,本質上是利用無人機工作時不可避免出現(xiàn)的音頻信號,通過多點布局的音頻傳感器采集、去噪,提取無人機自身獨有的音頻特征實現(xiàn)識別分類,進而可望基于音頻傳感器布局坐標進行定位跟蹤。由于無人機的機動水平較強,其音頻信號具有時間短、噪聲強、非線性、不平穩(wěn)、無先驗信息的特點,傳統(tǒng)音頻處理的Fourier分析方法不能準確反映非平穩(wěn)信號的時變特征,因此尋找適用于無人機的非平穩(wěn)過程的音頻信號處理方法將是出發(fā)點。本文采用基于EMD的能量比的特征提取方法,結合傳統(tǒng)的MFCC特征提取方法,將兩種特征用PCA降維處理后構成無人機聲信號的綜合特征向量,最后以VQ作為分類器實現(xiàn)不同型號的無人機聲信號分類和識別。
EMD的實質是依不同時間尺度特征將多分量信號分解成一系列單分量信號[1],即本征模態(tài)函數(shù)(Intrinsic Mode Function,IMF),并提取出該復雜信號的趨勢項,從而使得信號的瞬時頻率具有物理意義,其分解步驟如下[2-4]:
(1)將信號x(t)所有局部極大值點和局部極小值點分別用3次樣條曲線連接起來構成x(t)的上下包絡線,兩條曲線間包含所有的信號。計算其平均值曲線m1(t),進而得
將h1(t)作為待處理信號,重復上述求包絡均值和差值的計算,得到
直到h1k(t)符合IMF分量的特征,從原信號中分解得到了第1個IMF,記為
(2)從原信號中減去c1(t),得到第1階剩余信號r1(t)
把r1(t)作為新的信號重復步驟(1),將第2、第3直到第n-1個IMF分量若第N階IMF分量或其余量小于預先設定的值或變成1個單調函數(shù)時,篩選結束。這樣原始音頻數(shù)據(jù)可表示為有限個IMF和1個余項的和
IMF反映了原信號中不同的頻率成分,且n個IMF的頻率從大到小排列,余項變?yōu)楹艿皖l率的脈動即趨勢項。以大疆兩種型號無人機精靈Phantom 3和悟Inspire工作時音頻信號為例,進行EMD分解如圖1所示,文中數(shù)值實驗均是在Windows 10環(huán)境下用MATLAB 2011實現(xiàn)的。
從圖1(a)和圖1(b)中從上到下分依次為兩種不同型號無人機的聲信號、n階IMF分量和余項??梢钥闯鼍`Phantom 3聲信號經(jīng)由EMD分解后得到12個IMF分量,悟Inspire聲信號經(jīng)由EMD分解后得到11個IMF分量。EMD分解可以突出信號的某些局部特征,且余項反映了原信號的趨勢特征,有利于研究信號的變化趨勢。
圖1 不同型號無人機聲信號及EMD分解的時域波形
信號經(jīng)EMD分解后得到有限個IMF分量,每個分量均代表機動目標內部某一部件的頻率,因此各個分量的頻域能量可能存在某種關系。據(jù)此提出基于EMD的IMF能量比的特征提取算法,過程如下[5-6]。
對任一信號,定義第i階IMF的能量為
以各個IMF分量的能量(Ei)相對于原信號能量(E)的能量比作為特征向量,即
精靈Phantom 3和悟Inspire兩種無人機聲信號提取IMF能量比特征如圖2所示。
從圖2中可以看出,兩種類型的無人機信號分解得到的IMF分量的個數(shù)不同,在同一頻段下,不同類的信號能量也有比較明顯的區(qū)別,說明IMF可用于不同類目標的分類判別。
以基于EMD的IMF能量比作為特征對無人機類型進行識別,實驗對象選取市場上常見的3種不同型號的無人機包括大疆精靈Phantom3、大疆精靈Phantom4以及大疆悟Inspire。由于Phantom3與Phantom4在形狀、大小上較為相似容易混淆,可以更好地檢驗方法的有效性。
各取3型號無人機的35個聲信號作為訓練樣本,采樣頻率為44.1 kHz,并將信噪比為5、10、20的3種不同程度的高斯白噪聲加入原始聲信號中得到帶噪音頻,。提取EMD特征時以最大特征向量維數(shù)為基準,在其他向量尾部加0,使得3種類型無人機的特征向量維數(shù)相同。以3種類型的無人機包括所有訓練樣本在內的各60個聲信號作為測試樣本,使用VQ作為分類器對EMD特征向量進行分類與識別實驗,實驗結果如表1所示。
表1 3種型號無人機的EMD特征識別率/(%)
從表1可以看出,對于不同的信噪比,精靈Phantom 4的正確識別率不如其它兩種無人機,由于精靈Phantom4與精靈Phantom3外形相似,導致精靈Phantom4的識別率較低。在沒有噪聲干擾的情況下,3種無人機的識別結果較好,但是在噪聲環(huán)境下,整體的識別率較低,因為產品要最終應用到實際中,所以考慮一種廣泛用于語音識別的特征提取算法—MFCC。
MFCC是一種傳統(tǒng)且非常重要的特征提取算法,它模擬了人耳的聽覺感知特性來分析音頻的頻譜。根據(jù)實驗結果,人的主觀感知頻域的劃定并不是線性的,有下面的公式
其中:Fmel是以美爾(Mel)為單位的感知頻率;f是以Hz為單位的實際頻率。
MFCC特征提取的實質是將時域內的頻譜通過非線性的頻譜進行轉化,通過離散余弦變換得到MFCC倒譜。其計算流程如圖3所示。
圖2 不同型號無人機的IMF能量比特征
圖3 MFCC計算流程圖
將Phantom 3分別和Phantom 4、Inspire之間的MFCC參數(shù)進行比較,并選擇其中幾幀,如圖4所示。橫坐標是Phantom 3的MFCC參數(shù),縱坐標是Phantom 4或Inspire的MFCC參數(shù),如果某1階的特征相似,則系數(shù)分布應在虛線附近。
對3種無人機的聲信號提取16階MFCC參數(shù),同樣在原信號中加入信噪比為5、10、20 3種不同程度的高斯白噪聲,識別結果如表2所示。
表2 3種型號無人機的MFCC特征識別率/(%)
對比表1和表2發(fā)現(xiàn),對于Phantom 4,MFCC的識別效果要好于EMD,對于Phantom 3的識別,MFCC的效果又稍差于EMD,而對于Inspire,兩種方法的識別效果相近。所以考慮將以上兩種特征融合為一個新的特征。
由上述實驗可知兩個特征表現(xiàn)互有好壞,所以考慮將兩個特征融合得到一個新的特征。但如果只是簡單地將兩個特征結合,則會得到一個高維特征,也意味著計算復雜度的增加。本文利用主成分分析的最優(yōu)降維性質,在特征降維的同時,還能保證系統(tǒng)的識別性能。主成分分析(Primary Component Analysis,PCA)是一種在均方誤差最小意義上最優(yōu)的線性降維方法,通過PCA變換,特征向量中的主要成分能夠被保留下來[7]。
設X為p維向量,且X的協(xié)方差存在,令λi為X的特征值(這里的i代表從大到小的第i個位置),φi為λi對應的特征向量,X向量的第i個主成分因子則定義成
這里所有γi構成了特征空間一個正交基,它們之間不存在冗余。則γi的方差貢獻率為
將訓練集、測試集合分類器設置成與上一組實驗相同,然后應用PCA對兩種特征進行降維處理,得到16維的新的特征向量,其中包括7階EMD分量和9階MFCC分量,其他實驗變量的設置與前兩個實驗相同,分類結果如表3所示。
對比表1、表2和表3的分類結果可以看出,融合后的特征比使用單一特征具有更高的識別率,所以對于這種復雜的機動目標來說,選擇多種特征能更全面地表現(xiàn)不同類型無人機聲信號的特征。
圖4 不同型號無人機的MFCC參數(shù)比較
表3 3種型號無人機的EMD+MFCC特征識別率/(%)
本文從無人機噪聲的產生機理出發(fā),使用PCA綜合了兩種特征提取技術對不同類型的無人機聲信號進行特征提?。篗FCC以及基于EMD和能量比的特征提取算法。最后使用VQ作為分類器對兩種單一的特征和結合后的特征進行分類與識別實驗,可以看出,在單一特征的表現(xiàn)上,MFCC的識別率要略高于EMD,而將兩種特征融合后比起單一的特征分類效果更顯著,識別率更高。實驗證明了利用聲音感知技術來識別與監(jiān)管無人機的可行性。
參考文獻:
[1]NORDEN E HUANG,ZHENG SHEN,STEVEN R LONG.The empirical mode decomposition and the hilbert spectrum for nonlinear and non-stationayr time series analysis[C].Proceedings of the Royal Society London,1998(454):903-995.
[2]呂艷新.基于EMD和能量比的戰(zhàn)場聲目標分類與識別[J]. 振動與沖擊,2008,27(11):51-55.
[3]BOUDRAAAO,CEXUS J C,SAIDI Z.EMD-based signal filtering[J].IEEE Transactions on Instrumentation and Measurement,2007,56(6):2196-2202.
[4]趙知勁,黃艷波.基于經(jīng)驗模態(tài)分解的單通道盲源分離算法[J].計算機應用研究,2017,34(10):3010-3012.
[5]趙天青,梁旭斌,許學忠,等.EMD在目標聲信號特征提取中的應用研究[J].南京大學學報(自然科學版),2015(S1):102-106.
[6]徐可君,秦海勤,江龍平.基于EMD和HHT的航空發(fā)動機轉子-機匣振動信號分析[J].振動與沖擊,2011,30(7):237-240.
[7]ASTON JOHN A D,CHIOU JENG-MIN,EVANS JONATHANP,et al.Linguistic pitch analysis using functional principal component mixed effect models[J].Journal of the Royal Statistical Society Series CApplied Statistics,2010,59(2):297-317.