張惠臣,那 健,翟春平
(大連測(cè)控技術(shù)研究所,遼寧 大連 116013)
尋找黑匣子(飛機(jī)飛行數(shù)據(jù)記錄器(FDR)和船舶航行數(shù)據(jù)記錄器(VDR)的統(tǒng)稱)是飛機(jī)或船舶失事墜海后的緊迫任務(wù)。黑匣子上裝載的水下定位信標(biāo)(Underwater Locator Beacon)入水自動(dòng)激活電路,發(fā)射固定頻率的周期性聲脈沖信號(hào),供搜尋設(shè)備對(duì)黑匣子進(jìn)行定位。水聲信標(biāo)通常發(fā)送頻率為37.5 kHz的脈沖信號(hào),可從數(shù)千米深的水下傳遞聲信號(hào)。一旦水聲信標(biāo)開始工作,它將會(huì)每秒發(fā)送一次脈沖信號(hào)并持續(xù)一個(gè)月左右,這種脈沖信號(hào)可以被聲吶和聲學(xué)定位儀探測(cè)到[1-2]。定位失事的黑匣子,首先要檢測(cè)識(shí)別聲信標(biāo)信號(hào),因此對(duì)聲信標(biāo)信號(hào)的檢測(cè)識(shí)別成為黑匣子搜尋的關(guān)鍵技術(shù)。
水聲信號(hào)自動(dòng)識(shí)別是水下目標(biāo)識(shí)別技術(shù)研究的一個(gè)重要領(lǐng)域,也是水聲信號(hào)處理領(lǐng)域的突出難題。國外早期使用的水聲信號(hào)處理方法是盲源分離,國內(nèi)目前主要用到的水聲信號(hào)處理方法有傅里葉變換(短時(shí)傅里葉變換、分?jǐn)?shù)階傅里葉變換)、小波變換、希爾伯特黃變換、錯(cuò)誤疊加算法[3]等。目前的水聲信號(hào)處理方法在水聲信號(hào)處理領(lǐng)域已經(jīng)有著較為成熟的應(yīng)用。但對(duì)于大海中水聲信標(biāo)信號(hào)的檢測(cè)識(shí)別,這些常用的方法很容易受到水中傳播損失以及海洋環(huán)境背景噪聲等因素的影響,很難實(shí)現(xiàn)遠(yuǎn)距離情況下聲信標(biāo)信號(hào)的有效檢測(cè)識(shí)別[4]。
近年來人工智能(AI)技術(shù)飛速發(fā)展,為水聲信號(hào)處理領(lǐng)域帶來了新的思路?;诂F(xiàn)有的水聲信號(hào)處理技術(shù),本文提出一種新的聲信標(biāo)信號(hào)的檢測(cè)識(shí)別方法,即對(duì)已知聲信標(biāo)信號(hào)提取梅爾頻率倒譜系數(shù)特征,再將所提取聲信標(biāo)信號(hào)的特征輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí),然后將待測(cè)數(shù)據(jù)提取MFCC特征后,輸入卷積神經(jīng)網(wǎng)絡(luò)從而實(shí)現(xiàn)對(duì)聲信標(biāo)信號(hào)的檢測(cè)識(shí)別。
基于卷積神經(jīng)網(wǎng)絡(luò)的聲信標(biāo)信號(hào)通常為CW脈沖信號(hào),頻率 37.5 kHz,脈寬T=10 ms,重復(fù)周期 1 s,噪聲干擾為海洋背景噪聲。周期信號(hào)不滿足能量有限條件,對(duì)于周期信號(hào)、隨機(jī)信號(hào)在時(shí)間上的積分是無窮大,一般只研究信號(hào)的平均功率。在本文中,將聲信標(biāo)信號(hào)截取處理,即信號(hào)具有周期特性但并不是周期信號(hào)。設(shè)聲信標(biāo)信號(hào)為x(t)[4],則有
其中:A為幅度;f0為聲信標(biāo)信號(hào)的中心頻率;t′為聲信標(biāo)信號(hào)周期脈沖信號(hào)時(shí)間。圖1為聲信標(biāo)信號(hào)仿真時(shí)域圖以及頻譜圖。
圖1 聲信標(biāo)信號(hào)時(shí)頻分析Fig.1 Time-frequency analysis of acoustic beacon signals
為了識(shí)別出不同的聲音,需要對(duì)聲音提取內(nèi)在特征。一般要考慮到2個(gè)問題,一是提取出合適的特征參數(shù);二是進(jìn)行數(shù)據(jù)壓縮與降維。MFCC特征在近些年得到了廣泛應(yīng)用,早期應(yīng)用于語音信號(hào)的處理領(lǐng)域。水聲信號(hào)與語音信號(hào)識(shí)別的原理一樣,也可以應(yīng)用MFCC進(jìn)行水聲信號(hào)特征提取。本文采用MFCC作為聲信標(biāo)信號(hào)的特征參數(shù),梅爾(Mel)頻率可由下式計(jì)算得到:
MFCC 就是基于 Mel頻率的概念而提出來的[5-6]。MFCC的物理意義是:提取信號(hào)頻譜中的包絡(luò)信息,將聲音的物理信息(頻譜包絡(luò)和細(xì)節(jié))提取得到一組特征向量,簡(jiǎn)單來說可以理解為聲音信號(hào)的能量在不同頻率范圍的分布。MFCC特征參數(shù)提取流程如圖2所示。
圖2 MFCC 特征參數(shù)提取流程Fig.2 MFCC feature parameter extraction process
最終得到MFCC系數(shù)如下式[7]:
至此,一段聲音通過分幀、特征提取后,每幀都有一個(gè)特征向量,后續(xù)步驟要處理的對(duì)象就是這樣的特征向量。
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)是一類特殊的人工神經(jīng)網(wǎng)絡(luò)[8],是深度學(xué)習(xí)中的一種核心算法,區(qū)別于神經(jīng)網(wǎng)絡(luò)其他模型(如遞歸神經(jīng)網(wǎng)絡(luò)),其最主要的特點(diǎn)是卷積運(yùn)算操作。卷積神經(jīng)網(wǎng)絡(luò)有一個(gè)輸入層、一個(gè)輸出層和中間的多個(gè)隱藏層。中間的隱藏層由卷積、激活、池化(pooling)3種結(jié)構(gòu)組成[9]。卷積神經(jīng)網(wǎng)絡(luò)與全連接網(wǎng)絡(luò)相比較,有3個(gè)特點(diǎn):權(quán)值局部連接、權(quán)值共享和降采樣,以保證一定程度上的位移和旋轉(zhuǎn)不變性,并且大大減少網(wǎng)絡(luò)中需要訓(xùn)練的參數(shù)個(gè)數(shù)。本文所使用的卷積網(wǎng)絡(luò)框架如圖3所示。
圖3 卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 Convolutional neural network structure
對(duì)事先已知的聲信標(biāo)信號(hào)提取MFCC特征送入設(shè)置好的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。通過訓(xùn)練,輸入的是每類數(shù)據(jù)的MFCC特征,輸出對(duì)應(yīng)的標(biāo)簽,根據(jù)誤差后向傳導(dǎo)進(jìn)行訓(xùn)練,使用算法的人僅需提供原始時(shí)域數(shù)據(jù)即可。訓(xùn)練后,被測(cè)試數(shù)據(jù)先提取MFCC特征,再輸入卷積神經(jīng)網(wǎng)絡(luò),然后輸出對(duì)應(yīng)識(shí)別結(jié)果。
針對(duì)上文的聲信標(biāo)信號(hào)識(shí)別算法,利用試驗(yàn)數(shù)據(jù)對(duì)該方法進(jìn)一步驗(yàn)證。
試驗(yàn)船作為拖體布放母船,試驗(yàn)中1枚聲信標(biāo)布放在海底,該聲信標(biāo)信號(hào)中心頻率為37.5 kHz,采用拖曳裝置實(shí)現(xiàn)聲信標(biāo)信號(hào)采集,試驗(yàn)現(xiàn)場(chǎng)概況如圖4所示。
圖4 試驗(yàn)現(xiàn)場(chǎng)概況Fig.4 Test site overview
試驗(yàn)所使用的信標(biāo)如圖5所示,頻率37.5 kHz,脈寬 10 ms,脈沖周期 1 s。
圖5 試驗(yàn)水聲信標(biāo)Fig.5 Test underwater acoustic beacon
圖6為聲信標(biāo)信號(hào)距離拖體某一距離時(shí)的原始信號(hào)時(shí)域波形以及頻域波形圖。
把原始標(biāo)簽數(shù)據(jù)提取MFCC特征后,輸入設(shè)置好參數(shù)的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練效果隨著訓(xùn)練批次的變化如圖7所示??梢钥闯鰶]訓(xùn)練的卷積神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)參數(shù)是隨機(jī)初始化的,其輸出誤差最大,隨著訓(xùn)練批次的增加,誤差逐漸減少,訓(xùn)練批次到達(dá)1 000前,誤差減少得比較快,當(dāng)訓(xùn)練批次超過1 000次之后,誤差減少得越來越慢。經(jīng)測(cè)試,本次實(shí)驗(yàn)基于卷積網(wǎng)絡(luò)的正確率為93.9%。
將距離聲信標(biāo)為1 900 m時(shí)的待測(cè)試的聲信標(biāo)信號(hào)提取MFCC特征后輸入已經(jīng)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò),識(shí)別并標(biāo)記后的聲信標(biāo)信號(hào)時(shí)域圖如圖8所示。12 s內(nèi)共有12個(gè)脈沖標(biāo)記(白色標(biāo)記為聲信標(biāo)信號(hào)),每間隔1 s標(biāo)記一次。結(jié)果表明,當(dāng)距離為1 900 m時(shí)可全階段檢測(cè)識(shí)別到聲信標(biāo)脈沖信號(hào)。
圖6 原始信號(hào)時(shí)域波形及頻域波形Fig.6 Time-domain and frequency-domain waveforms of the original signal
圖7 卷積神經(jīng)網(wǎng)絡(luò)訓(xùn)練誤差變化圖Fig.7 CNN training error graph
圖8 1 900 m 時(shí)檢測(cè)識(shí)別結(jié)果Fig.8 Detection and recognition results at 1 900 m
將距離聲信標(biāo)為2 600 m時(shí)的待測(cè)試的聲信標(biāo)信號(hào)提取MFCC特征后輸入已經(jīng)訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò),識(shí)別并標(biāo)記后的聲信標(biāo)信號(hào)時(shí)域圖如圖9所示。12 s內(nèi)共有9個(gè)脈沖標(biāo)記,脈沖信號(hào)標(biāo)記不完整。結(jié)果表明,當(dāng)距離為2 600時(shí)可檢測(cè)識(shí)別到部分聲信標(biāo)脈沖信號(hào)。
圖9 2 600 m 時(shí)檢測(cè)識(shí)別結(jié)果Fig.9 Detection and recognition results at 2 600 m
在試驗(yàn)驗(yàn)證的過程發(fā)現(xiàn)對(duì)輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練的聲信標(biāo)信號(hào)數(shù)據(jù)必須是全時(shí)間段可檢測(cè)識(shí)別的聲信標(biāo)信號(hào)(下文稱為正常訓(xùn)練數(shù)據(jù)),如果訓(xùn)練數(shù)據(jù)是部分時(shí)間段可識(shí)別的聲信標(biāo)信號(hào)(下文稱為非正常訓(xùn)練數(shù)據(jù))則對(duì)測(cè)試數(shù)據(jù)的結(jié)果產(chǎn)生較大的誤差。
使用相同的測(cè)試數(shù)據(jù)對(duì)不同情況下的訓(xùn)練完成的卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試。圖8為正常訓(xùn)練數(shù)據(jù)下的聲信標(biāo)距離為1 900 m時(shí)測(cè)試數(shù)據(jù)檢測(cè)識(shí)別結(jié)果,結(jié)果顯示此測(cè)試數(shù)據(jù)完全可識(shí)別,即1 s內(nèi)有一個(gè)聲信標(biāo)信號(hào)脈沖發(fā)出。圖10為非正常訓(xùn)練數(shù)據(jù)下的聲信標(biāo)距離為1 900 m時(shí)測(cè)試數(shù)據(jù)檢測(cè)識(shí)別結(jié)果,結(jié)果顯示此測(cè)試數(shù)據(jù)識(shí)別出現(xiàn)錯(cuò)誤,1 s內(nèi)有多個(gè)標(biāo)記的脈沖信號(hào)。
圖10 1 900 m 非正常訓(xùn)練數(shù)據(jù)測(cè)試結(jié)果Fig.10 1 900 m abnormal training data test results
本文將基于卷積神經(jīng)網(wǎng)絡(luò)方法應(yīng)用于對(duì)水聲定位信標(biāo)信號(hào)的檢測(cè)識(shí)別。使用已知的聲信標(biāo)信號(hào)作為訓(xùn)練數(shù)據(jù),然后對(duì)試驗(yàn)獲取的待測(cè)聲信標(biāo)信號(hào)進(jìn)行測(cè)試。測(cè)試結(jié)果表明,在訓(xùn)練數(shù)據(jù)正常的情況下,將待測(cè)聲信標(biāo)信號(hào)提取MFCC特征后輸入卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試,測(cè)試數(shù)據(jù)的識(shí)別效果較好。本文所使用的方法對(duì)訓(xùn)練數(shù)據(jù)要求較高,訓(xùn)練數(shù)據(jù)必須是全時(shí)間段可檢測(cè)識(shí)別的聲信標(biāo)信號(hào),對(duì)于部分時(shí)間段識(shí)別的聲信標(biāo)信號(hào)測(cè)試結(jié)果出現(xiàn)錯(cuò)誤。