亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于MFCC特征的被動水聲目標(biāo)深度學(xué)習(xí)分類方法

        2020-11-14 07:17:58楊路飛章新華吳秉坤李蘭瑞
        艦船科學(xué)技術(shù) 2020年10期
        關(guān)鍵詞:聲吶被動卷積

        楊路飛,章新華,吳秉坤,李蘭瑞

        (1.海軍大連艦艇學(xué)院,遼寧大連116018;2.海軍裝備部駐上海地區(qū)第一軍事代表室,上海200120)

        0 引言

        被動聲吶目標(biāo)識別[1]一直是水下對抗與反潛研究領(lǐng)域的熱點和難點。傳統(tǒng)的被動聲吶分類模型有基于專家系統(tǒng)的,如支持向量機,有基于淺層機器學(xué)習(xí)的,如BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)[2]。支持向量機具有所需訓(xùn)練樣本數(shù)量少,泛化性能好的優(yōu)點,但存在著大樣本處理復(fù)雜等缺點。BP神經(jīng)網(wǎng)絡(luò)具有大規(guī)模樣本處理能力,魯棒性好的優(yōu)點,但存在容易過擬合,學(xué)習(xí)不到樣本的深度特征等缺點。

        將深度學(xué)習(xí)應(yīng)用于被動聲吶目標(biāo)分類問題已經(jīng)是研究的趨勢[3–9]。近些年,深度學(xué)習(xí)[10–13]在語音識別領(lǐng)域取得了突破性進(jìn)展,長短時記憶網(wǎng)絡(luò)[14](Long Short Term Memory Network,LSTM)處理時序數(shù)據(jù)能力強,基于感知機理的語音梅爾頻率倒譜系數(shù)(MFCC)的LSTM模型應(yīng)用最廣泛。已有研究者將MFCC與LSTM應(yīng)用于被動聲吶目標(biāo)分類,取得較好識別能力,但LSTM模型預(yù)訓(xùn)練收斂速度慢,循環(huán)次數(shù)多且需大量的樣本,預(yù)訓(xùn)練準(zhǔn)確率才能趨于平穩(wěn)。卷積神經(jīng)網(wǎng)[15](Convolutional Neural Network,CNN)可以學(xué)習(xí)到樣本數(shù)據(jù)的空間深度特征,通常研究者會提取被動聲吶目標(biāo)的二維圖像特征進(jìn)行分類。研究表明一維卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)比二維卷積神經(jīng)網(wǎng)絡(luò)(2DCNN)更適合處理語音信號,收斂速度更快。本文通過提取水上和水下被動聲吶目標(biāo)的MFCC特征,結(jié)合1DCNN提取空間深度特征的能力與LSTM提取時序深度特征的能力,構(gòu)建一個Conv-LSTM深度學(xué)習(xí)網(wǎng)絡(luò)架構(gòu)的分類模型,用于被動聲吶目標(biāo)分類。

        1 被動聲吶目標(biāo)MFCC特征的提取

        在語音識別方面,常用到的特征是梅爾倒譜系數(shù)(Mel-scale Frequency Cepstal Coefficients,簡稱MFCC)。根據(jù)人耳機理的研究發(fā)現(xiàn),人耳對不同頻率的聲波有不同的聽覺敏感度,對低頻敏感度較高,對高頻敏感度較低。MFCC[16]是在Mel標(biāo)度頻率域提取出來的倒譜參數(shù),Mel標(biāo)度描述了人耳頻率非線性特性,它與頻率的關(guān)系可近似表示為:

        參數(shù)MFCC提取過程如圖1所示。

        圖1 MFCC系數(shù)提取過程Fig.1 MFCCcoefficient extraction process

        預(yù)加重可以提升信號的高頻部分,使信號的頻譜變得平坦,能用相同的信噪比求頻譜。語音信號一幀s(n)一般取20~30 ms,為避免相鄰兩幀變化較大,要取一段重疊區(qū)域,一般取一幀的0.3~0.5。將每一幀乘以一個漢明窗,即帶通濾波器:

        s(n)w(n)x(n)

        式中: 為分幀后信號; 為窗口函數(shù),為加窗后的信號。

        將每幀進(jìn)行快速傅里葉變換得到每幀在頻譜上的能量分布:

        式中,N為采樣點的個數(shù)。

        將能量譜通過一組Mel尺度的三角形濾波器組。三角形濾波器組的作用是對頻譜進(jìn)行平滑,消除諧波,還可以降低運算量,三角形濾波器的頻帶寬度隨級數(shù)的增大而變寬。

        三角形濾波器的頻率響應(yīng)為:

        計算每個濾波器組輸出的對數(shù)能量:

        最后經(jīng)離散余弦變換(DCT)得到MFCC系數(shù):

        式中,L階指MFCC系數(shù)的階數(shù)。

        標(biāo)準(zhǔn)的倒譜參數(shù)MFCC只反映了信號參數(shù)的靜態(tài)特性,信號的動態(tài)特性可以用這些靜態(tài)特征的差分譜來描述。差分參數(shù)的計算公式為:

        式中:dt表示第t個1階差分;Ct表示第t個倒譜系數(shù);Q表示倒譜系數(shù)的階數(shù);K表示1階導(dǎo)數(shù)的時間差,可取1或2。將上式中結(jié)果再帶入就可以得到2階差分的參數(shù)[17]。

        本文提取被動聲納目標(biāo)的靜態(tài)特性(MFCC系數(shù))和動態(tài)特性(1階差分,2階差分),作為被動聲納目標(biāo)分類的特征,即MFCC特征。

        2 深度學(xué)習(xí)分類模型

        2.1 一維卷積神經(jīng)網(wǎng)絡(luò)模型

        卷積神經(jīng)網(wǎng)絡(luò)(CNN)可以較好識別數(shù)據(jù)中的簡單模式,從而生成更復(fù)雜的模式,是一種監(jiān)督學(xué)習(xí)的判別模型,其具有局部連接、權(quán)值共享、下采樣的特點。二維卷積神經(jīng)網(wǎng)絡(luò)(2DCNN)主要用于圖像識別,一維卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)主要用于處理語音的任務(wù)。無論幾維的卷積神經(jīng)網(wǎng)絡(luò),都具有相同的特點和相同的處理辦法。CNN主要由輸入層、卷積層、池化層、全連接層和輸出層組成。1DCNN基本結(jié)構(gòu)如圖2所示。

        圖2 一維卷積神經(jīng)網(wǎng)絡(luò)簡單模型Fig.2 Simple model of one-dimensional convolutional neural network

        卷積層由多個濾波器組成,學(xué)習(xí)輸入數(shù)據(jù)的特征表示,不同大小的卷積核可提取出不同的特征信息,而權(quán)值共享的方式減少了模型的復(fù)雜度,減少了過擬合的風(fēng)險,提高了模型的泛化能力。池化層一般連接在卷積層之后,對特征進(jìn)行降維,常用的方法包括最大池化和平均池化。全連接層通過反向傳播算法對網(wǎng)絡(luò)中的參數(shù)進(jìn)行訓(xùn)練,來最小化損失函數(shù)[18]。損失函數(shù)常使用交叉熵函數(shù)。引入Dropout技術(shù),減輕網(wǎng)絡(luò)過擬合,降低訓(xùn)練模型計算量。

        本文處理的被動聲吶目標(biāo)輻射噪聲信號屬于聲音,提取的MFCC特征也具有序列特性,所以本文采用1DCNN處理被動聲吶信號的MFCC,獲取數(shù)據(jù)的卷積深度特征。

        2.2 LSTM深度學(xué)習(xí)模型原理

        LSTM是循環(huán)神經(jīng)網(wǎng)絡(luò)[19](RNN)的改進(jìn)型,是為了解決RNN模型訓(xùn)練過程中存在梯度消失或梯度爆炸等問題提出的。目前,LSTM逐漸取代RNN,成為處理語音任務(wù)的主要模型。典型LSTM單元如圖3所示。

        圖3 典型LSTM單元Fig.3 Typical LSTM units

        LSTM存在3個門:遺忘門(Forget gate),更新門(Update gate),輸出門(Output gate),分別用Gu,Gf,Go來 表 示。輸 入 為at?1,ct?1,xt,輸 出 為at,ct,yt,。遺忘門和更新門決定ct的值,輸出門決定at的值。具體公式為:

        式中:wc,wu,wf,wo為權(quán)值;bc,bu,bf,bo為偏置。

        本文采用LSTM處理被動聲吶信號的MFCC特征,獲取數(shù)據(jù)的時序深度特征。

        2.3 Conv-LSTM模型

        被動聲吶目標(biāo)信號是一種聲音信號,具有時間序列特性。MFCC特征是聲音信號經(jīng)過分幀后處理得到的特征數(shù)據(jù),具有空間連續(xù)特性以及時序連續(xù)特性。1DCNN可以用來處理語音信號,利用其空間特性提取了數(shù)據(jù)的空間深度特征,LSTM具有提取數(shù)據(jù)時序深度特性的能力,常被用來處理帶有時間序列性質(zhì)的問題。根據(jù)兩種模型的特性,本文構(gòu)造一種1DCNN和LSTM結(jié)合的深度學(xué)習(xí)分類模型Conv-LSTM,充分將被動聲納信號提取的MFCC特征的時空特性用于分類識別。Conv-LSTM模型的網(wǎng)絡(luò)架構(gòu)如圖4所示。

        圖4 Conv-LSTM分類模型網(wǎng)絡(luò)架構(gòu)Fig.4 Network architecture of Conv-LSTM classification model

        卷積層之間添加了BatchNorm層,在預(yù)訓(xùn)練過程中,使得每一層神經(jīng)網(wǎng)絡(luò)的輸入保持相同分布,訓(xùn)練收斂快,加快訓(xùn)練速度。使用GlobalAveragePooling進(jìn)行均值池化,輸出為一維卷積深度特征。MFCC特征經(jīng)過LSTM模塊后,再經(jīng)過Flatten操作得到一維時序深度特征。將卷積深度特征與時序深度特征經(jīng)過Concatenate操作得到聯(lián)合深度特征,最后通過BP算法進(jìn)行目標(biāo)的分類。

        3 基于MFCC的被動聲吶目標(biāo)信號實測數(shù)據(jù)的實驗

        本文使用實測的被動聲吶目標(biāo)信號,提取聽覺特征MFCC,對1DCNN,LSTM和Conv-LSTM的分類性能進(jìn)行實驗。

        本文實驗是水上水下分類識別的二分類問題,選取A,B兩類的實測被動聲吶目標(biāo)輻射噪聲信號,每類目標(biāo)信號的采樣頻率為25 kHz。其中信號A是商船等各種類型的水上目標(biāo),信號B為水下目標(biāo),且包含了同一艘船、艇在不同工況條件下的信號,保證了樣本集的有效性和實用性。提取目標(biāo)信號的聽覺特征MFCC,分幀時長為30 ms,幀移為12 ms,mel濾波器的階數(shù)為24階,20 ms提取一個36維的MFCC特征向量,取時長1.31 s的被動聲吶目標(biāo)信號的MFCC為一個樣本,如圖5所示,構(gòu)建樣本集。

        圖5 目標(biāo)MFCC特征的一個樣本Fig.5 A sample of the characteristics of the target MFCC

        超參數(shù)的設(shè)置對于深度學(xué)習(xí)模型訓(xùn)練的效果影響很大,為了保證實驗結(jié)果的合理性,為了提高目標(biāo)分類識別的準(zhǔn)確率,進(jìn)行超參數(shù)的調(diào)整。

        對于1DCNN模型,卷積層為3層,濾波器的個數(shù)分別為64,128,64,窗口大小為4,卷積層和池化層的激活函數(shù)選用Relu,全連接層為2層,每層神經(jīng)網(wǎng)絡(luò)單元個數(shù)分別是128,64,對于二分類問題,輸出層的激活函數(shù)選用sigmoid,學(xué)習(xí)率為0.01,優(yōu)化器使用Adam,損失函數(shù)交叉熵函數(shù)選用Binary-crossentropy,分批訓(xùn)練大小為128,訓(xùn)練次數(shù)epochs設(shè)為100。

        對于LSTM模型,LSTM單元個數(shù)為64,輸出層的激活函數(shù)選用sigmoid,學(xué)習(xí)率為0.01,優(yōu)化器使用Adam,損失函數(shù)交叉熵函數(shù)選用Binary-crossentropy,分批訓(xùn)練大小為128,訓(xùn)練次數(shù)epochs設(shè)為100。

        對于Conv-LSTM模型,一維卷積模塊中卷積層為3層,濾波器的個數(shù)分別為64,128,64,窗口大小為4,卷積層激活函數(shù)選用Relu,BatchNorm有3層,循壞模塊與LSTM模型相同。輸出層使用了’one-hot’編碼。

        實測數(shù)據(jù)中,每艘船的輻射噪聲信號實測時長不同。其中,B類目標(biāo)的數(shù)據(jù)樣本少,A類目標(biāo)的數(shù)據(jù)樣本多。為保證深度學(xué)習(xí)模型訓(xùn)練過程的泛化能力,防止過擬合,A,B的訓(xùn)練集樣本數(shù)不能相差太大。本文仿真實驗采用2種樣本構(gòu)建方法對水聲目標(biāo)進(jìn)行分類識別。

        3.1 方案1及分類結(jié)果

        在方案1中,選取A類船28艘,B類船12艘。該方案提取所有船只的MFCC特征,每隔5個MFCC特征選取一個作為訓(xùn)練集樣本,其余MFCC特征作為測試集樣本。樣本構(gòu)建結(jié)果如表1所示。

        表1 水上、水下目標(biāo)樣本構(gòu)建Tab. 1 Construction of water and underwater target samples

        以預(yù)訓(xùn)練網(wǎng)絡(luò)對測試集樣本進(jìn)行識別分析。為了使得深度學(xué)習(xí)模型訓(xùn)練更加均衡化,訓(xùn)練及樣本通過shuffle進(jìn)行了亂序。在每次深度網(wǎng)絡(luò)模型訓(xùn)練過程,模型的權(quán)值與偏置的最終值會不同,損失函數(shù)可能落在不同的極小值點,從而使得測試集的準(zhǔn)確率發(fā)生改變,所以本文所有實驗重復(fù)5次,結(jié)果取平均值,如圖6是某次深度學(xué)習(xí)Conv-LSTM模型預(yù)訓(xùn)練的準(zhǔn)確率與損失函數(shù)變化過程。

        分類識別結(jié)果如表2所示。

        3.2 方案2及分類結(jié)果

        方案2中同方案1,選取28艘A類船,12艘B類船。該方案分別從A,B類選取一部分船,提取MFCC特征構(gòu)建訓(xùn)練集,未被挑選的船只提取MFCC特征,構(gòu)建測試集。樣本構(gòu)建的結(jié)果如表3所示。

        圖6 預(yù)訓(xùn)練準(zhǔn)確率與損失函數(shù)變化圖Fig.6 Variation of pre-training accuracy and loss function

        表2 水上、水下目標(biāo)分類準(zhǔn)確率Tab.2 Classification accuracy of water and water targets

        分類識別結(jié)果如表4所示。

        表3 水上、水下目標(biāo)樣本構(gòu)建Tab.3 Construction of water and underwater target samples

        表4 水上、水下目標(biāo)分類準(zhǔn)確率Tab.4 Classification accuracy of water and water targets

        4 結(jié)語

        本文從被動聲吶目標(biāo)分類出發(fā),利用一維卷積神經(jīng)網(wǎng)絡(luò)(1DCNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM)以及構(gòu)建的Conv-LSTM深度學(xué)習(xí)分類模型,對被動聲吶目標(biāo)的聽覺特征MFCC進(jìn)行提取與識別。根據(jù)海測數(shù)據(jù)處理以及深度學(xué)習(xí)分類模型的分類效果可得到如下結(jié)論:

        提取被動聲吶目標(biāo)的聽覺特征與深度學(xué)習(xí)分類模型結(jié)合,進(jìn)行被動聲吶目標(biāo)分類具有可行性。

        不同深度學(xué)習(xí)分類模型對于被動聲吶目標(biāo)分類效果不同。根據(jù)實測的被動聲吶目標(biāo)信號構(gòu)建適合的深度學(xué)習(xí)分類器,可以提高被動聲吶目標(biāo)分類的準(zhǔn)確率,Conv-LSTM相較于LSTM深度學(xué)習(xí)分類模型的分類準(zhǔn)確率提高了4%左右。

        深度學(xué)習(xí)可以從大量的樣本數(shù)據(jù)中學(xué)習(xí)到目標(biāo)的深度特征,由于實測樣本數(shù)量較少。限制了對目標(biāo)深度特征的挖掘,對于深度學(xué)習(xí)分類模型的泛化能力還需要進(jìn)一步研究。

        猜你喜歡
        聲吶被動卷積
        探索大洋的“千里眼”——聲吶
        基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
        新聞?wù)Z篇中被動化的認(rèn)知話語分析
        一種便攜式側(cè)掃聲吶舷側(cè)支架的設(shè)計及實現(xiàn)
        聲吶
        主動句都能轉(zhuǎn)換成被動句嗎
        第五課 拒絕被動
        趣味(語文)(2019年5期)2019-09-02 01:52:44
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        COTS技術(shù)在聲吶裝備中的應(yīng)用
        久久精品国产亚洲av久五月天| 日韩二三区| 欧美丝袜激情办公室在线观看| 亚洲熟女天堂av一区二区三区| 国产精品久久久久久久久久红粉| 午夜精品一区二区三区的区别| 激情五月天伊人久久| 国产麻豆成人精品av| 午夜视频在线观看一区二区小| 亚洲v欧美v国产v在线观看 | 热久久国产欧美一区二区精品| 亚洲国产av一区二区三区四区| 视频女同久久久一区二区三区| 国产精品老熟女乱一区二区| 老师露出两个奶球让我吃奶头 | 98国产精品永久在线观看| 久久人妻精品免费二区| 久久精品人人做人人爱爱| 国产成人亚洲日韩欧美| 丰满熟妇人妻无码区| 成人国产一区二区三区av| 国产精品久久久久久久| 久久香蕉国产线看观看网| 日韩精品极品免费观看| 国产色视频一区二区三区不卡| 国产精品你懂的在线播放| 麻豆国产巨作AV剧情老师| 伊人影院成人在线观看| 人妻激情偷乱视频一区二区三区| 老头巨大挺进莹莹的体内免费视频 | 亚洲综合视频一区二区| 久久亚洲国产高清av一级| 欧美a级在线现免费观看| 曰本女人牲交全视频免费播放| 欧美亚洲另类国产18p| 人妻中文字幕日韩av| 亚洲精品成人网线在线播放va| 视频国产精品| 国产一区资源在线播放| 男女啪动最猛动态图| 午夜三级网|