亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于非負矩陣分解的次聲信號分類方法?

2023-07-13 12:20:16孟子軒張?zhí)煊?/span>滕鵬曉

應(yīng)用聲學 2023年3期

關(guān)鍵詞：集上字典度量

孟子軒程巍張?zhí)煊?呂君滕鵬曉

(1 中國科學院聲學研究所北京 100190)

(2 中國科學院噪聲與振動重點實驗室北京 100190)

(3 中國科學院大學北京 100049)

0 引言

次聲是指頻率低于20 Hz 的聲信號。自然環(huán)境與人類社會中廣泛存在著次聲信號，許多物理現(xiàn)象在發(fā)生和發(fā)展過程中都會伴隨低頻次聲信號的產(chǎn)生，例如自然活動中的地震、臺風、閃電、火山噴發(fā)和海嘯以及人類活動中的核和化學爆炸、火箭發(fā)射、飛機起飛等事件[1]。從災(zāi)害預(yù)防的角度看，對次聲信號的識別分類能夠起到預(yù)警的作用；在軍事對抗領(lǐng)域，通過次聲信號來識別敵對方的軍事活動對國防安全具有十分重要的意義。

自1996 年全面禁止核試驗條約組織(Comprehensive nuclear-test-ban treaty organization,CTBTO)成立以來，次聲成為國際監(jiān)測系統(tǒng)(International monitoring system,IMS)所使用的4種主要監(jiān)測核爆的手段之一，利用機器學習方法對次聲信號進行識別分類的研究也由此展開[2]。對于次聲信號的識別分類任務(wù)而言，由于樣本數(shù)量較少，因此研究的關(guān)鍵問題在于信號的特征提取[3?4]。吳涢暉[5]采用了8 種不同的特征提取方式對化學爆炸、閃電和臺風3 類事件進行處理，對比了支持向量機(Support vector machines,SVM)、BP神經(jīng)網(wǎng)絡(luò)、長短時神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN) 4 種分類器的分類性能，結(jié)果表明SVM的識別性能最好。同時指出，其構(gòu)建的分類流程對人工設(shè)計的特征有較高的要求，需要研究人員對各種信號的特征進行深入的研究和挑選，以找出區(qū)分度較大的特征。

譚笑楓等[6]以數(shù)據(jù)驅(qū)動為出發(fā)點，采用CNN進行特征提取、模型訓練和識別分類，以簡化特征設(shè)計過程，其提出的方法在CTBTO 提供的化爆與地震兩類次聲數(shù)據(jù)集上達到了82.72%的準確率，但該方法對數(shù)據(jù)量的要求較高，難以應(yīng)用于小樣本數(shù)據(jù)集的情況。本文從矩陣分解的角度，考慮采用淺層的模型對次聲信號進行特征提取，以適用于小樣本場景下的次聲信號分類任務(wù)。

戴翊靖等[7]考慮到次聲信號特性與樣本量小的特點，采用非負矩陣分解(Non-negative matrix factorization,NMF)進行次聲降噪。該方法的研究對象為一段混合的次聲信號，將預(yù)訓練的平穩(wěn)噪聲作為監(jiān)督項，通過NMF 方法將信號中的目標部分與噪聲部分分離，然后恢復(fù)目標信號。其目的在于獲得較高信噪比的目標信號，以便于后續(xù)的次聲監(jiān)測任務(wù)。本文聚焦于分類的具體應(yīng)用，對于大氣次聲波的產(chǎn)生和傳播機理研究以及次聲事件的影響和防治策略都有重要意義。特別是本研究使用的NMF 方法處理結(jié)果是在可靠的先驗信息標注的多條數(shù)據(jù)庫上獲得的，其目的在于提取目標信號的基本組成部分，分別作為不同類信號的特征。特征提取后使用SVM 等分類器完成識別分類任務(wù)，是次聲監(jiān)測的重要環(huán)節(jié)，也是大氣次聲學的一項基礎(chǔ)性研究。

1 特征提取算法及分類模型

1.1 NMF理論

NMF 是一種廣泛應(yīng)用于圖像識別、語聲增強以及聲事件識別等領(lǐng)域的算法[8?10]，其基本框架由Lee 等[11]提出。定義非負矩陣V ∈Rf×t，此處非負的含義是指V中的任一元素Vij≥0。NMF 的目的是希望得到兩個非負矩陣W與H，同時保證二者乘積與一個V盡可能接近：

在本文中，V為原信號經(jīng)短時傅里葉變換(Short-time Fourier transform,STFT)后得到的時頻圖，而W ∈Rf×d與H ∈Rd×t則表示經(jīng)訓練后從數(shù)據(jù)中學習到的特征，其具體含義往往與實際問題相關(guān)。W可以認為是V中的基本組成部分，被稱為字典矩陣，其列向量被稱為字典原子；而H被稱為激活矩陣，表示在V中這些部分在相應(yīng)時間點上的線性組合計權(quán)，其行向量被稱為字典原子的激活系數(shù)；參數(shù)d則表示字典矩陣中字典原子的個數(shù)[12?13]，此時有

式(2)中，wi與hi分別為字典原子與相應(yīng)的激活系數(shù)。由于通常設(shè)定d ?min(f,t)，即只用很少的字典原子來描述原信號，因此只有在W包含了原信號中最主要的組成時，才會使得式(1)成立[12]，本文將這些表示原信號基本部分的字典原子作為特征輸入，采用SVM等分類器進行識別分類任務(wù)。

W和H可通過最小化V與WH之間的距離度量函數(shù)得到，即求解如下的優(yōu)化問題[11]：

式(3)中，D表示V與WH之間的距離度量函數(shù)，其定義為

式(5)中，i=1,2,···,f；j=1,2,···,t。應(yīng)用梯度下降法對式(5)進行迭代求解，J(W,H)分別對Wil與Hlj的偏導(dǎo)數(shù)為

其中，l=1,2,···,d，T表示矩陣轉(zhuǎn)置。則基于梯度下降法的迭代規(guī)則，由式(6)和式(7)可得

其中，λil和μlj是迭代步長。乘性更新法則對步長進行限制，規(guī)定其取值為

將式(10)與式(11)分別帶入式(8)與式(9)中，得到歐幾里得距離度量下的乘性更新法則：

式(12)與式(13)的非增性在文獻[15]中得到了證明?？梢钥闯?，采用式(12)與式(13)迭代求解式(3)時只進行乘法和加法運算，從而保證了迭代過程及結(jié)果的非負性。

對于不同的距離度量函數(shù)而言，其乘性更新法則可采用統(tǒng)一的形式給出[13]：

式(14)中，β的不同取值代表采用不同的距離度量函數(shù)，?表示對矩陣元素的乘法，同時指數(shù)運算和除法運算均表示對元素的運算。

1.2 分類模型

一個完整的識別分類系統(tǒng)如圖1 所示。分類模型的選擇主要包括傳統(tǒng)機器學習算法與深度神經(jīng)網(wǎng)絡(luò)兩類。SVM 是一種廣泛應(yīng)用于次聲信號識別分類領(lǐng)域的機器學習模型，由于其分類面完全由支持向量確定，因此在小樣本場景下有較好的表現(xiàn)性能[16]。

圖1 識別分類系統(tǒng)框圖Fig.1 Block diagram of the classification system

SVM 的基本模型是定義在特征空間上的間隔最大的二分類線性分類器[14]，即求解如下的優(yōu)化問題：

式(15)中，w為分類超平面的法向量，xi為第i個輸入，yi為輸入對應(yīng)的標簽，b則表示超平面的偏置量。式(15)是在數(shù)據(jù)集線性可分的情況下得到的，又被稱為線性可分SVM。對于一般的線性不可分數(shù)據(jù)集，通常是對式(15)添加懲罰項，允許部分樣本不滿足約束，則式(15)可改寫為

式(16)中，?(·)表示損失函數(shù)。若采用合頁損失函數(shù)，同時引入松弛變量ξi≥0，可以得到線性SVM模型，如下：

采用拉格朗日乘子法，可以得到式(17)的對偶問題，如下：

式(18)中，αi表示拉格朗日乘子。式(15)與式(18)到的SVM 分類面均為線性分類面，通過采用核技巧，可以得到更為一般的SVM形式，如下：

式(19)中，κ(·)表示核函數(shù)。若選用線性核函數(shù)，則式(19)退化為式(18)。幾種常用的核函數(shù)包括線性核、高斯核、多項式核等，需在實際使用時進行選擇。以上提出的SVM 均為二分類模型，對于K種類別的多分類問題，目前最常用的方法是分別構(gòu)建K個獨立的SVM[17]：當訓練第k個模型時，使用當前類別yk作為正樣本數(shù)據(jù)，而將其余的K?1 個類別作為負樣本。

由于所提特征是一種二維數(shù)據(jù)，因此同時使用CNN 進行分類。LeNet-5 是一種經(jīng)典的CNN 結(jié)構(gòu)[18?19]，其網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

圖2 CNN 結(jié)構(gòu)圖Fig.2 CNN structure diagram

LeNet-5 是一種較為淺層的CNN，其輸入經(jīng)過兩層卷積層、兩層池化層后與全連接神經(jīng)網(wǎng)絡(luò)相連，最后輸出其類別概率。為保證泛化能力，每層網(wǎng)絡(luò)均添加正則化項，并采用Dropout進行隨機失活。

2 分類設(shè)計與實驗結(jié)果分析

2.1 數(shù)據(jù)來源及預(yù)處理

中國科學院聲學研究所計劃在全國范圍內(nèi)建設(shè)廣域多臺陣次聲監(jiān)測網(wǎng)絡(luò)，現(xiàn)已在新疆、遼寧、云南等地建設(shè)了固定式次聲臺陣，并通過機動式次聲探測站對酒泉、文昌等發(fā)射基地的次聲信號進行收集。通過逐步多通道相關(guān)方法等陣列處理算法得到每個信號的相速度、入射角和聲源位置等聲學參數(shù)，并結(jié)合聲源信息的驗證，對于信號的類別可以進行準確的標注，經(jīng)過準確標注的實測數(shù)據(jù)集為本研究奠定了重要的基礎(chǔ)，有利于推動我國次聲監(jiān)測技術(shù)的發(fā)展，對于自然災(zāi)害預(yù)警以及國防建設(shè)等領(lǐng)域具有重大意義。

本文使用的數(shù)據(jù)為通過實地布陣自行采集的次聲時域信號，數(shù)據(jù)集大小為105 條，包括4 種類型的信號，其中爆炸信號17 條，地震信號22 條，閃電信號41條，再入信號25條。本文采用原信號進行過STFT 后的時頻圖作為輸入。4 類信號經(jīng)STFT 后的時頻圖如圖3所示。

圖3 4 類信號時頻圖Fig.3 The spectrograms of four kinds of signals

圖3 所有標注出的紅色方框區(qū)域均為信號部分。就信號的頻率維特征而言，爆炸事件與地震事件的主要頻率分布在5 Hz 以下，其中地震事件在該頻帶中的分布比較均勻，而爆炸事件則分布在2～4 Hz，相對集中；閃電事件的頻帶較寬，在20 Hz以上仍有部分信號，主要部分明顯地集中在5 Hz 和15 Hz 左右，分成了兩個部分；再入事件的頻率則分布在15 Hz 以下，主要部分在5 Hz 以下，持續(xù)時間較短。從時頻圖上可以看出各信號之間存在明顯差異。由于各個信號均為實際采集信號，則不可避免地混有了噪聲成分，這干擾了識別分類任務(wù)。為了找出目標信號的主要部分，同時對原始數(shù)據(jù)進行降維，需要進行特征提取工作。圖3中呈現(xiàn)的4類次聲波頻譜隨時間的變化，和持續(xù)時間的長短都有顯著的差異，其形成機制復(fù)雜，本研究尚未涉及，暫時擱置，留待進一步的研究。

本文采用NMF 對圖3 所示的4 類信號時頻圖進行特征提取。在NMF 中，字典原子個數(shù)d是需要預(yù)先設(shè)置的參數(shù)，可采用經(jīng)驗的參考取值[20]，但在實際應(yīng)用時仍需進行調(diào)整。首先對圖3 所示的4 類信號進行NMF 分解，采用歐幾里得距離作為代價函數(shù)，迭代次數(shù)設(shè)置為200 次，在d=8 時得到的爆炸信號收斂曲線如圖4所示。

圖4 爆炸信號收斂曲線Fig.4 The convergence curves of four kinds of explosion signals

圖4 中黑實線表示全部事件的度量函數(shù)值平均值，上下兩條虛線則分別表示全部事件度量函數(shù)值的上下限。為了保證特征能夠充分反映原始信號，要求選取的迭代次數(shù)使得信號的距離度量函數(shù)充分收斂。從圖4 中可以看出，經(jīng)過50 次迭代后度量函數(shù)已趨于收斂，同時經(jīng)實驗驗證，繼續(xù)增大迭代次數(shù)對于分類準確率的影響不大，綜合計算效率與分類準確率，本文選取迭代次數(shù)為200。4 類信號經(jīng)NMF分解得到的W矩陣與H矩陣如圖5所示。

圖5 4 類事件NMF 分解結(jié)果Fig.5 NMF decomposition results of four kinds of events

圖5 中左側(cè)為信號的字典矩陣，右側(cè)為激活矩陣。結(jié)合圖3 與圖5，可以看出字典矩陣是對信號時頻譜的一種降維表示，不同類之間的字典矩陣有明顯差異，因此本文選取W作為信號的特征向量進行分類實驗。

2.2 實驗環(huán)境

本文使用的數(shù)據(jù)集中訓練集與測試集的比例為7 : 3，由于數(shù)據(jù)量有限，因此不再設(shè)計驗證集，而是在訓練時采用四折交叉驗證的方式進行模型選擇。識別分類實驗包括兩部分，分別是基于經(jīng)驗?zāi)B(tài)分解(Empirical mode decomposition,EMD)和NMF 的識別分類實驗。分類實驗在AMD?4600H平臺上進行，操作系統(tǒng)為Windows10，所用軟件為Python3.6.8，CNN 的開發(fā)框架為Tensorflow2.4.0，SVM模型由Sklearn模塊提供。

2.3 實驗結(jié)果與分析

2.3.1 基于EMD的分類過程

基于EMD 的特征提取主要是對分解得到的各階本征模態(tài)函數(shù)(Intrinsic mode function,IMF)分量進行處理[3,5]，可選擇的處理方式包括計算分量各階矩、能量、信息熵、波形特征、分量比等，經(jīng)處理后的各分量仍可繼續(xù)提取其能量、信息熵或波形特征等特征。本文采用時域能量、時域熵、EMD能量、EMD 熵、EMD 奇異值以及希爾伯特邊際譜(Hilbert marginal spectrum,HMS)[21]4 種特征作為對比。以HMS 為例，對識別分類過程進行說明。提取HMS 時首先對時域信號進行EMD，將得到的IMF進行希爾伯特變換，構(gòu)造出原信號的解析信號，從而得到原信號的希爾伯特譜，HMS 即為希爾伯特譜的時間維積分結(jié)果，反映了瞬時頻率的時域幅值累加。對得到的HMS進行主成分分析(Principal component analysis,PCA)，取前30維作為SVM輸入進行分類。本文采取隨機優(yōu)化的方式對SVM 進行參數(shù)選擇，以相同條件進行100次分類實驗，在測試集上的分類結(jié)果如圖6所示。

圖6 HMS-SVM 測試集分類結(jié)果Fig.6 Test set classification results of HMS-SVM

圖6中橫坐標為HMS-SVM在測試集上的分類準確率，縱坐標則表示在100 次實驗中不同準確率出現(xiàn)的次數(shù)，藍色柱狀圖為實驗數(shù)據(jù)記錄，紅色曲線為使用正態(tài)分布擬合的結(jié)果。從圖6 中可以看出，HMS-SVM 在測試集上的分類準確率最大值為87.5%，平均值為69.76%，方差為7.65%，多數(shù)分類結(jié)果集中在60%～80%之間。本文還提取了時域能量、時域熵、EMD能量、EMD熵等4 種特征，在上述實驗條件下進行分類實驗，分別使用SVM 與一維CNN作為分類器，其結(jié)果見表1。

表1 5 種特征分類結(jié)果Table 1 Five feature classification results

從表1 中可以看出，在本文所使用的數(shù)據(jù)集中，5 種特征中最高的準確率為EMD 熵特征，達到了68.71%。進行EMD 后使用熵作為特征的準確率提升較高，而使用能量作為特征的準確率則有所下降。在進行實驗前無法確定最優(yōu)的特征提取方式，需要根據(jù)分類結(jié)果對特征向量進行設(shè)計以獲取最佳特征。

2.3.2 基于NMF的分類過程

使用NMF 進行特征提取時，除字典原子個數(shù)外，還需要考慮距離度量函數(shù)的選取。本文比較了歐幾里得距離(β=2)、廣義K-L 散度(β=1)和IS散度(β=0)三種距離度量函數(shù)下不同字典原子個數(shù)的分類結(jié)果。分別采用SVM與CNN作為分類器，在相同條件下進行100 次分類實驗，取分類準確率的平均值作為最終結(jié)果，實驗結(jié)果如圖7 所示。3 種距離度量函數(shù)下，在驗證集上平均準確率的最大值見表2。

表2 不同距離度量函數(shù)下的分類結(jié)果Table 2 Classification results under different distance measurement functions(單位: %)

圖7 不同度量函數(shù)下的分類結(jié)果Fig.7 Classification results under different metric functions

圖7 中綠色虛線表示訓練集上的分類結(jié)果，藍色點劃線表示測試集上的分類結(jié)果，左右兩側(cè)分別為使用SVM 和CNN 的分類結(jié)果。表2 表示采用SVM 與CNN 作為分類器時，不同距離度量函數(shù)下的平均準確率最大值以及相應(yīng)的字典原子數(shù)。

結(jié)合圖7 與表2，在同樣使用NMF 方法作為特征輸入的情況下，使用SVM 作為分類器的效果好于LeNet 的分類結(jié)果，其平均準確率的最大值在β=1、d=1 時取得，即距離度量函數(shù)選取為廣義K-L散度、字典原子數(shù)選取為1的情形。在不同的度量函數(shù)下，訓練集上的分類準確率隨字典原子個數(shù)的增加而增加，但是在測試集上，分類準確率隨字典原子個數(shù)增加呈下降趨勢。這是由于原始信號中實際上包含了目標次聲信號與噪聲成分，而次聲信號的頻率低、頻帶窄，目標信號與噪聲信號的頻帶混合嚴重[7]。當字典原子數(shù)較低時，其取值主要由目標信號決定；而當字典原子數(shù)較高時，其取值同時受到噪聲影響。因此當較高維度的特征向量輸入分類器后，產(chǎn)生了過擬合現(xiàn)象，識別準確率下降。對于CNN 來說，其訓練集上的準確率較高，但在測試集上效果并不好，平均準確率均在70%以下，這說明對于小樣本的次聲信號識別分類任務(wù)而言，采用較深度的復(fù)雜模型并不是一個理想的選擇，其效果差于SVM分類器。

2.3.3 實驗結(jié)果分析

兩組實驗在測試集上的分類結(jié)果對比如圖8所示，圖中增加了采用一維CNN 對HMS 特征進行分類的結(jié)果。從圖8 中可以看出，基于HMS 的方法雖然提高了時頻分析的分辨能力，但其特征提取的方式較為直接，采用幅值相加的方式將全部分量值降為一維信號，對于原始信號來說有較多的信息損失，因此其識別的準確率并不高。在測試集上，采用NMF-SVM 進行分類的準確率最高，并且在字典原子數(shù)較低時即取得了較好的結(jié)果。

圖8 兩組實驗分類結(jié)果對比Fig.8 Comparison of classification results of two groups of experiments

結(jié)果表明，對于次聲分類這一小樣本分類任務(wù)而言，采用過高維度的特征向量或過深的網(wǎng)絡(luò)模型進行分類效果欠佳，很容易受到訓練模型過擬合的影響，因此應(yīng)該采用較低維的特征向量與淺層的分類模型，以提高泛化能力，獲得更好的分類性能。

3 結(jié)論

對于小樣本的識別分類任務(wù)，其關(guān)鍵問題在于特征向量的設(shè)計。本文以嚴格標定的數(shù)據(jù)集為基礎(chǔ)，針對爆炸、地震、閃電和再入這4類次聲信號的識別分類問題，引入了NMF 對次聲信號進行特征提取，并分別使用SVM 與CNN 作為訓練模型進行分類。實驗結(jié)果表明，NMF-SVM 在測試集上的平均準確率可以達到83.13%，在當前數(shù)據(jù)集上獲得了最佳的性能，是一種適用于次聲信號識別分類的方法。