吳涢暉,趙子天,陳曉雷,鄒士亞*
(1. 軍事科學(xué)院防化研究院 北京 昌平區(qū) 102205;2. 電子科技大學(xué)計算機(jī)科學(xué)與工程學(xué)院 成都 611731)
大氣低頻聲監(jiān)測技術(shù)是中遠(yuǎn)程核爆炸探測的技術(shù)手段之一,次聲監(jiān)測已被聯(lián)合國列入全面禁核試監(jiān)測技術(shù)[1]。然而,自然界存在著多種大氣低頻聲信號,如何對這些信號數(shù)據(jù)進(jìn)行實時分析和識別,是核爆探測需要解決的一個問題,需要有效的技術(shù)方法來支持。深度學(xué)習(xí)的快速發(fā)展以及其不斷提高的性能為解決這個問題提供了另外一個途徑[2]。
深度學(xué)習(xí)是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)發(fā)展而來[3],文獻(xiàn)[4-5]提出,具有多層結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)比淺層神經(jīng)網(wǎng)絡(luò)具有更強(qiáng)的學(xué)習(xí)能力,從而可以將原始輸入數(shù)據(jù)中人工分析難以獲取的特征信息挖掘出來。
本文首先對核爆低頻聲的特征進(jìn)行了分析并對機(jī)器學(xué)習(xí)中的支持向量機(jī)和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行了研究,然后針對這些特征對化爆、雷電、臺風(fēng)的低頻聲信號進(jìn)行了特征提取,并構(gòu)造了多分類支持向量機(jī)和卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行識別實驗,最后對學(xué)習(xí)過程進(jìn)行了改進(jìn),獲得了較好的性能。
在大氣層核爆炸的瞬間,核爆產(chǎn)生的能量被限制在具有極高溫度、極大壓力的小體積內(nèi)。在不到1 μs 內(nèi)這種高溫氣體產(chǎn)生大量的軟X 射線,這些射線被周圍1 m 內(nèi)的空氣吸收,使其迅速膨脹,在約1 ms 內(nèi)產(chǎn)生一個直徑超過100 m 的灼熱、極高的白熾狀火球。火球繼續(xù)以超聲速膨脹,并以約100 m/s 的速度緩慢上升。然后,近似球形的上升火球變成具有中心上升氣流的蘑菇云?;鹎蚶^續(xù)在大氣中上升、冷卻,直到放射性煙云的重力與其在大氣中的浮力相等為止[6]。
核爆炸時不到1 s 內(nèi)產(chǎn)生強(qiáng)大的沖擊波,在初始幾秒內(nèi)以超聲速膨脹火球向外傳播,沖擊波陣面的超壓是火球內(nèi)部高壓的2~3 倍。50 s 后,沖擊波可傳播到離爆心約20 km 處[7]。大氣層核爆炸產(chǎn)生的沖擊波慢慢衰減成聲波后,會發(fā)生頻散現(xiàn)象,低頻成分傳播速度快而衰減慢,高頻成分傳播速度慢而衰減快。由于幾何擴(kuò)散和高頻成分被大氣吸收而慢慢演變成低頻聲信號[8]。核爆炸產(chǎn)生的低頻聲信號的波形取決于核爆當(dāng)量和距離源的距離。由于高頻信號比低頻信號衰減得快,因此,離源很遠(yuǎn)的地方觀測到的信號以長周期低頻聲波為主。如前所述,在離爆心約1000 km 內(nèi)的近場觀測到的低頻聲信號呈現(xiàn)為一系列到達(dá)時間不同的波組,這是由于平流層和熱電離層大氣的一次或多次反射造成的。與此相反,在距離為幾千km 的遠(yuǎn)場,觀測到的低頻聲波是由首先到達(dá)的蘭姆波成分和隨后到達(dá)的幾個有層理的聲波成分疊加而成的。
根據(jù)國內(nèi)外對大氣層核爆炸低頻聲的觀測與研究,其特征主要包括以下幾個方面:
1)信號的振幅與距離、爆炸當(dāng)量和平流層的風(fēng)速分量有關(guān),其計算公式可以表示為[9]:
式中,Pc為含風(fēng)干擾修正的次聲監(jiān)測聲壓,單位為Pa;W 為核爆當(dāng)量,單位為kT;R 為監(jiān)測點與爆心的距離,單位為km;
2)信號的頻率大約在0.002~20 Hz 之間,對于小當(dāng)量(幾kt)的核爆,頻率大約在0.02~4 Hz之間[10];
3)信號的周期大約在0.01~100 s 之間;
4)由于平流層和熱電離層大氣一次或多次反射,以及高頻信號比低頻信號率減快,使得信號由幾個有層理的聲波成分疊加而成,出現(xiàn)明顯的頻散現(xiàn)象[11];
5)波形呈“壓縮式”變化。
這些特征是對信號進(jìn)行識別的基礎(chǔ),通過對這些特征建立相應(yīng)的數(shù)學(xué)模型,計算出信號的特征值,然后進(jìn)行深度學(xué)習(xí)來達(dá)到識別事件的目的。
本文采用中科院聲學(xué)所的InSAS2008 型電容式低頻聲傳感器在全國各地分別搭建了實驗臺站。實驗臺站由次聲監(jiān)測陣、數(shù)據(jù)信息處理中心和通信設(shè)備等組成。其中,次聲監(jiān)測陣為三元陣,每個次聲傳感器配置降噪管陣;數(shù)據(jù)信息處理中心負(fù)責(zé)各陣元的數(shù)據(jù)接收與處理。實驗臺站結(jié)構(gòu)組成如圖1 所示。采集的樣本數(shù)據(jù)共有600 個,其中包含化爆數(shù)據(jù)16 個,臺風(fēng)數(shù)據(jù)36 個,閃電數(shù)據(jù)248 個,噪聲數(shù)據(jù)300 個。
圖1 實驗臺站結(jié)構(gòu)組成圖
針對核爆低頻聲的基本特征,本文對化爆、閃電、臺風(fēng)3 種事件的低頻聲信號,提取出了最大幅值、均值、方差、有效值、偏斜度、短時平均過零率、波形復(fù)雜度、頻率三次矩等8 種特征值組成特征向量數(shù)據(jù)集來進(jìn)行機(jī)器學(xué)習(xí)實驗。
最大幅值:對原始信號進(jìn)行去本底和大氣擾動后,采樣點數(shù)據(jù)的最大值,用Max 表示。
均值:信號各采樣點數(shù)據(jù)的平均值,用μ表示。
方差:信號各采樣點數(shù)據(jù)與均值之差平方和的平均數(shù),用σ 表示。
有效值:可以衡量信號的能量效應(yīng),用Ev 表示[12]:
偏斜度:衡量數(shù)據(jù)分布偏斜方向及程度,能夠表示波形的分布方向,用Sc 表示[15]:
短時平均過零率:指每幀內(nèi)信號通過零值的次數(shù),在一定程度上可以反映信號的頻率信息,用Zn 表示[13]:
N 為采樣點個數(shù),sgn(x)為符號函數(shù),x≥0 時,sgn(x)=1,x<0 時,sgn(x)=?1。
波形復(fù)雜度:用于表示信號波形在能量分布上的復(fù)雜程度,用Cp 表示:
頻率三次矩:用于表示信號頻譜特性,用Ft 表示:
由于各維特征的計算方法不同,其值大小差異很大,在進(jìn)行實驗前還要分別對各特征維進(jìn)行歸一化處理。
目前,構(gòu)造支持向量機(jī)多分類模型的方法主要有兩種,一種是直接構(gòu)造多個分類面對所有樣本進(jìn)行劃分,將多個分類面的參數(shù)求解合并到一個最優(yōu)化問題中,通過求解多目標(biāo)函數(shù)的最優(yōu)化問題實現(xiàn)多類分類,簡稱直接法[14]。這種方法看似簡單,但其最優(yōu)化問題求解過程復(fù)雜,計算復(fù)雜度高,實現(xiàn)起來比較困難。另一種方法是將多分類問題分解為多個二分類問題,通過組合這些二分類器來間接實現(xiàn)多分類器的構(gòu)造,簡稱間接法[15]。
由于樣本數(shù)據(jù)只包括化學(xué)爆炸、閃電、臺風(fēng)和噪聲4 類數(shù)據(jù),因此采用間接法構(gòu)造分類模型,可以降低模型的計算復(fù)雜度。將支持向量機(jī)作為神經(jīng)網(wǎng)絡(luò)的隱層節(jié)點,依次分別把化學(xué)爆炸、閃電、臺風(fēng)和噪聲作為一類,其他3 類樣本歸為另一類,總共需要構(gòu)造4 個支持向量機(jī)。判別時,輸入數(shù)據(jù)分別經(jīng)過這4 個支持向量機(jī)共得到4 個輸出值,將輸出值經(jīng)過一個線性激活函數(shù)進(jìn)行比較,最大者對應(yīng)類別為輸入數(shù)據(jù)的類別,從而實現(xiàn)4 類數(shù)據(jù)的識別。
對于化學(xué)爆炸事件的識別,隨機(jī)抽取12 組化學(xué)爆炸特征數(shù)據(jù)作為正樣本(其余4 組化學(xué)爆炸特征數(shù)據(jù)用來測試),閃電、臺風(fēng)、噪聲3 類數(shù)據(jù)各隨機(jī)抽取6 組特征數(shù)據(jù)作為負(fù)樣本,共同組成訓(xùn)練集對一個支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.25,選取幅值特征和均值特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖2 所示。
對于閃電事件的識別,隨機(jī)抽取186 組閃電特征數(shù)據(jù)作為正樣本(其余62 組閃電特征數(shù)據(jù)用來測試),隨機(jī)抽取134 組噪聲特征數(shù)據(jù)、全部化學(xué)爆炸和臺風(fēng)特征數(shù)據(jù)組成負(fù)樣本,共同組成訓(xùn)練集對一個支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.15,選取幅值特征和均值特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖3所示。
對于臺風(fēng)事件的識別,隨機(jī)抽取27 組臺風(fēng)特征數(shù)據(jù)作為正樣本(其余9 組臺風(fēng)特征數(shù)據(jù)用來測試),化學(xué)爆炸、閃電、噪聲3 類數(shù)據(jù)各隨機(jī)抽取10 組特征數(shù)據(jù)作為負(fù)樣本,共同組成訓(xùn)練集對一個支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.20,選取幅值特征和均值特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖4 所示。
圖2 化爆SVM 訓(xùn)練結(jié)果
圖3 閃電SVM 訓(xùn)練結(jié)果
圖4 臺風(fēng)SVM 訓(xùn)練結(jié)果
對于噪聲的識別,隨機(jī)抽取400 組噪聲特征數(shù)據(jù)作為正樣本,全部化學(xué)爆炸、閃電、臺風(fēng)特征數(shù)據(jù)作為負(fù)樣本,共同組成訓(xùn)練集對一個支持向量機(jī)進(jìn)行訓(xùn)練,懲罰因子取0.10,選取短時平均過零率特征和波形復(fù)雜度特征進(jìn)行可視化,訓(xùn)練結(jié)果如圖5 所示。
圖5 噪聲SVM 訓(xùn)練結(jié)果
用訓(xùn)練好的4 個SVM 模型分別對測試樣本進(jìn)行預(yù)測分類,每一個樣本得到4 個預(yù)測類別得分值,分值最高的類別即為該樣本的識別結(jié)果。選取特征6 和特征7 對識別結(jié)果進(jìn)行可視化,得到測試樣本的真實分布與支持向量機(jī)的預(yù)測分布如圖6 所示,各種事件的識別結(jié)果見表1。
從以上實驗結(jié)果中可以看出,這8 種特征對于化爆、閃電、臺風(fēng)和噪聲這4 種類型的數(shù)據(jù),支持向量機(jī)有較好的分類性能,且只需要訓(xùn)練4 個分類器,計算速度相對較快。
卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)是一類包含卷積計算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一[16]。卷積神經(jīng)網(wǎng)絡(luò)的隱含層一般包含卷積層、池化層和全連接層3 類常見結(jié)構(gòu),在一些新的算法中可能有Inception模塊、殘差模塊等復(fù)雜結(jié)構(gòu),卷積層和池化層為卷積神經(jīng)網(wǎng)絡(luò)所特有[17]。
卷積層的功能是對輸入數(shù)據(jù)使用卷積核進(jìn)行卷積運算,生成特征圖。卷積核的每個元素都對應(yīng)一個權(quán)重系數(shù)和一個偏差量,類似于一個前饋神經(jīng)網(wǎng)絡(luò)的神經(jīng)元[18]。進(jìn)行卷積計算時,卷積核在輸入矩陣中滑動,每滑動到一個位置,就根據(jù)其大小對輸入特征做矩陣元素乘法求和并疊加偏差量。若Zl為第l 層特征圖,則第l+1 層特征圖的計算方法為:
式中,(i,j)為特征圖像素點下標(biāo);w 為卷積核;b 為偏差量。設(shè)第l 層特征圖為行列均是Ll的方陣,卷積核大小為f,卷積步長為s0,填充層數(shù)為p,則:
圖6 支持向量機(jī)在測試集上的預(yù)測結(jié)果
表1 SVM 測試結(jié)果
在卷積層進(jìn)行特征提取后,輸出的特征圖傳遞至池化層進(jìn)行特征選擇和信息過濾,起到壓縮數(shù)據(jù)減少參數(shù)數(shù)量的作用。池化層將特征圖中一些相鄰區(qū)域中的點用某一統(tǒng)計量進(jìn)行代替,一般取池化區(qū)域內(nèi)的最大值或平均值。池化的過程與卷積核掃描特征圖類似,由池化大小f、步長s0和填充層數(shù)p 控制,其一般表示形式為:
卷積神經(jīng)網(wǎng)絡(luò)的最后部分是一個全連接層,它等價于傳統(tǒng)前饋神經(jīng)網(wǎng)絡(luò)中的隱含層,只用于對提取的特征進(jìn)行非線性組合以得到輸出。其網(wǎng)絡(luò)結(jié)構(gòu)包含3 個卷積層、3 個池化層和一個全連接層。
卷積神經(jīng)網(wǎng)絡(luò)主要用于圖像識別,其識別能力在某些方面已經(jīng)遠(yuǎn)遠(yuǎn)超過人腦。但對于低頻聲傳感器采集的離散信號,無法直接對信號特征進(jìn)行識別。因此,本文將SVM 識別實驗中采集的600 個樣本數(shù)據(jù)通過傅里葉變換轉(zhuǎn)換為時頻特征圖[19],并進(jìn)行機(jī)器學(xué)習(xí)實驗。圖7 為從4 種類型的數(shù)據(jù)中各隨機(jī)選取一個樣本進(jìn)行轉(zhuǎn)換的結(jié)果。
圖7 各類信號時頻圖示例
實驗中,分別從噪聲數(shù)據(jù)和事件數(shù)據(jù)中隨機(jī)抽取3/5 的樣本作為訓(xùn)練集,其余樣本作為測試集,以檢驗訓(xùn)練得到的網(wǎng)絡(luò)的分類能力,訓(xùn)練集和測試集的樣本分布如圖4 所示。為了消除訓(xùn)練集和測試集隨機(jī)選取帶來的影響,實驗進(jìn)行多次運行,再對結(jié)果進(jìn)行統(tǒng)計。
然后將訓(xùn)練樣本的時頻特征圖輸入到卷積神經(jīng)網(wǎng)絡(luò)中對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,經(jīng)過75 次迭代,訓(xùn)練準(zhǔn)確率達(dá)到99.9%,測試準(zhǔn)確率達(dá)到96.0%,訓(xùn)練準(zhǔn)確率和損失率變化如圖8 所示。
對各種事件的識別結(jié)果如表2 所示,可以看出此方法的總體識別率和支持向量機(jī)相差不大,但是對于樣本數(shù)據(jù)較少的化爆,其識別效果依然不理想。
由于在現(xiàn)實環(huán)境中,化爆數(shù)據(jù)較少,無法采集到大量有效的數(shù)據(jù)作為訓(xùn)練樣本。為了解決上述由于化爆樣本量不足引起的識別率低的問題,本文將生成式對抗網(wǎng)絡(luò)與卷積神經(jīng)網(wǎng)絡(luò)相結(jié)合,把增強(qiáng)后的化爆數(shù)據(jù)輸入到卷積神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練。
圖8 訓(xùn)練準(zhǔn)確率和損失率變化曲線
表2 CNN 測試結(jié)果
生成式對抗網(wǎng)絡(luò)(generative adversarial nets,GAN)由文獻(xiàn)[20-22]于2014 年提出,它主要包括學(xué)習(xí)數(shù)據(jù)分布的生成模型(G)和分辨數(shù)據(jù)真實性的判別模型(D)兩個部分。在網(wǎng)絡(luò)的訓(xùn)練過程中,兩個模型交替優(yōu)化,不斷地進(jìn)行對抗,最終達(dá)到一個動態(tài)均衡,從而具有輸出與訓(xùn)練樣本相似的新數(shù)據(jù)的能力。
采用GAN 對化爆數(shù)據(jù)進(jìn)行了訓(xùn)練和生成,增加了一倍的化爆偽樣本數(shù)據(jù),然后使用CNN 進(jìn)行識別實驗,實驗結(jié)果如表3 所示,訓(xùn)練準(zhǔn)確率為99.8%,測試準(zhǔn)確率為93.0%,特別是對化爆數(shù)據(jù)的識別上,性能有較大的提升,但仍然不夠理想,需要進(jìn)一步的研究。
表3 改進(jìn)后測試結(jié)果
從以上實驗結(jié)果可以看出,SVM 和CNN 兩種模型都具有較高的識別能力,但由于事件數(shù)據(jù)類型分布不均,對于樣本數(shù)據(jù)較少的事件,識別準(zhǔn)確率偏低。從這個角度出發(fā),對模型的假正率(false positive rate, FPR)和真正率(true positive rate, TPR)進(jìn)行綜合評價。剔除對事件識別無用的噪聲數(shù)據(jù),對化爆、閃電、臺風(fēng)3 種類型的數(shù)據(jù)進(jìn)行識別實驗,將分類模型的輸出修改為每一個樣本數(shù)據(jù)被識別為3 種事件的概率,分別計算它們的ROC 曲線和AUC 值,所得結(jié)果如圖9 所示。
圖9 模型的ROC 曲線
通過多次實驗,對模型的AUC 值進(jìn)行統(tǒng)計,并對其概率密度函數(shù)進(jìn)行擬合,所得結(jié)果如圖10所示。
圖10 模型AUC 值擬合概率密度曲線
SVM 模型的AUC 值近似服從參數(shù)為(α =54.4831,β = 2.06348)的β 分布,期望值E(x) =0.9635。而CNN 模型的AUC 值近似服從參數(shù)為(α = 37.0722,β = 3.24117)的β 分布,期望值E(x) =0.9196。對于本文研究的次聲數(shù)據(jù)樣本分布的特點,SVM 模型的AUC 值總體高于CNN 模型,即SVM 模型性能較高。
在本文的研究中,支持向量機(jī)模型的識別性能較好,但它對人工設(shè)計的特征有較高的要求,需要研究人員對各種信號的各種特征進(jìn)行深入的研究,以便找出區(qū)別較大的信號特征。且對于多種類型數(shù)據(jù)的分類而言,需要訓(xùn)練多個支持向量機(jī)模型,當(dāng)有新的類別加進(jìn)來時,需要對所有的模型進(jìn)行重新訓(xùn)練。
卷積神經(jīng)網(wǎng)絡(luò)以其在圖像識別中的優(yōu)良性能,可以挖掘出人工設(shè)計時忽略的時頻特征,從而較為準(zhǔn)確地對本文中的3 種大氣低頻聲信號的頻譜圖進(jìn)行識別,但對于小樣本數(shù)據(jù),依然存在學(xué)習(xí)不充分的問題。采用生成式對抗網(wǎng)絡(luò)對學(xué)習(xí)過程進(jìn)行改進(jìn),能改善對特定事件的識別效果,可以進(jìn)一步結(jié)合CNN 與GAN 進(jìn)行研究,以達(dá)到更好的效果。