亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        水下聲目標(biāo)的梅爾倒譜系數(shù)智能分類方法

        2019-05-22 09:39:16張少康田德艷
        應(yīng)用聲學(xué) 2019年2期
        關(guān)鍵詞:特征提取分類記憶

        張少康 田德艷

        (1 海軍潛艇學(xué)院 青島 266000)

        (2 青島海洋科學(xué)與技術(shù)試點(diǎn)國家實(shí)驗(yàn)室 青島 266000)

        0 引言

        傳統(tǒng)水下聲目標(biāo)識別分類方法需要人工提取具有可推廣性、泛化能力強(qiáng)的特征數(shù)據(jù),其過程繁瑣復(fù)雜,專業(yè)性強(qiáng),需要人的參與,識別分類過程具有較強(qiáng)的人機(jī)交互特性。近幾年,隨著浮標(biāo)潛標(biāo)、水下滑翔機(jī)、AUV、UUV 等水下無人潛航器的發(fā)展,基于水下無人移動平臺的聲學(xué)探測體系正在不斷建立完善。水下聲目標(biāo)識別分類是水聲探測的“瓶頸”,同時也是關(guān)鍵技術(shù)之一。未來水下無人聲學(xué)探測預(yù)警體系要求潛航器本身具備水下聲目標(biāo)識別分類能力,而傳統(tǒng)水下聲目標(biāo)識別分類方法已無法滿足此要求,因此研究智能化水下聲目標(biāo)識別分類方法具有重要意義。

        一直以來,特征向量提取方法都是水下聲目標(biāo)識別分類的研究重點(diǎn),基于聽覺特征的水下聲目標(biāo)特征提取方法是研究熱點(diǎn)之一,其中,基于語音識別方法提取梅爾倒譜系數(shù)(Mel frequency cepstrum coefficient, MFCC)進(jìn)行水下聲目標(biāo)識別是常用的方法之一。如文獻(xiàn)[1]介紹了差分梅爾頻率倒譜系數(shù)的概念和相應(yīng)的特征提取方法,對水下目標(biāo)進(jìn)行了基于MFCC 特征提取方法仿真研究和實(shí)驗(yàn)分析;文獻(xiàn)[2]將MFCC 特征應(yīng)用于船舶和鯨類水下聲信號的特征提取中,提取了船舶和鯨類聲信號的MFCC 特征,通過高斯混合模型對提取的MFCC特征進(jìn)行訓(xùn)練和識別分類,討論MFCC維數(shù)變化和不同MFCC 特征組合對識別分類性能的影響;另外文獻(xiàn)[3–5]也進(jìn)行了MFCC 特征提取相關(guān)方面的研究工作,并取得了一定的研究成果。近幾年來,以深度學(xué)習(xí)為代表的人工智能算法發(fā)展迅速,深度學(xué)習(xí)是人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,于2006年被提出[6],目前已發(fā)展出自編碼器(Auto encode, AE)[7]、深度置信網(wǎng)絡(luò)(Deep belief networks,DBN)[8]、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)[9?10]、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural networks, RNN)[11?13]、生成對抗網(wǎng)絡(luò)(Generative adversarial network, GAN)[14?15]及其相關(guān)變種等多種模型,在各個領(lǐng)域得到廣泛的應(yīng)用,其中,長短時記憶(Long short-term memory, LSTM)網(wǎng)絡(luò)在語音識別領(lǐng)域應(yīng)用效果顯著。

        深度學(xué)習(xí)具備從大量數(shù)據(jù)中自動學(xué)習(xí)特征的能力,但其在水下聲信號識別分類領(lǐng)域的應(yīng)用目前還處于起步階段。區(qū)別于語音識別,水下聲信號識別分類具有樣本量少、數(shù)據(jù)獲取困難等特點(diǎn),因此有必要首先對其進(jìn)行特征提取。從當(dāng)前研究情況來看,采用MFCC特征提取方法對水下聲目標(biāo)信號進(jìn)行特征提取和識別分類被證明為一種行之有效的手段,但上述方法均采用了傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)或支持向量機(jī)(Support vector regression, SVM)模型作為分類器,相比之下,深度學(xué)習(xí)方法更具有挖掘深層次數(shù)據(jù)特征的能力,并更好地解決了模型訓(xùn)練過程中的梯度彌散和數(shù)據(jù)規(guī)模問題。另外,當(dāng)前研究均針對水面艦船等有人平臺的水聲目標(biāo)識別分類問題,而非未來水下無人平臺。

        未來水下無人平臺進(jìn)行水下目標(biāo)識別分類的主要任務(wù)是能夠正確區(qū)分水面、水下兩類目標(biāo)。因此,本文以此為研究目的,通過對水上、水下兩類水聲目標(biāo)信號進(jìn)行分析,提取MFCC 特征向量,作為樣本有監(jiān)督預(yù)訓(xùn)練長短時記憶網(wǎng)絡(luò)模型,采用訓(xùn)練好的分類模型,對實(shí)際水聲信號進(jìn)行預(yù)測分類,驗(yàn)證了模型的有效性。

        1 MFCC水下聲目標(biāo)特征提取與智能識別分類

        1.1 MFCC水下聲目標(biāo)特征提取

        MFCC 特征提取最早應(yīng)用于語音識別,是一種有效的特征提取方法,其特征提取過程如圖1所示[1]。

        圖1 MFCC 特征提取過程Fig.1 Feature extraction process of MFCC

        (1)分幀

        分幀是語音信號分析中常用的處理過程,由于目標(biāo)噪聲信號本質(zhì)上是非平穩(wěn)過程,具有時變特性,因此通常對信號作分幀處理進(jìn)行短時分析,提取幀特征參數(shù),最后由若干幀特征參數(shù)共同組成訓(xùn)練樣本特征向量。為保持每幀信號之間的連續(xù)性,幀與幀之間存在交疊,稱為“幀移”,本文每幀長度取25 ms,幀移取10 ms。

        (2)求能量譜

        通過快速傅里葉變換得到幀信號頻譜,進(jìn)而得到信號能量譜,其公式可表述為

        其中,x(n)為輸入幀信號,X(f)為輸入幀信號頻譜。

        (3)濾波

        將求得的能量譜通過梅爾濾波器組,其公式可表述為

        其中,N為各幀信號總點(diǎn)數(shù),Hm(f)梅爾濾波器組系數(shù)。

        (4)對數(shù)運(yùn)算

        將濾波后的能量譜作對數(shù)運(yùn)算,其公式可表述為

        (5)求倒譜

        將上述對數(shù)能量譜求離散余弦變換,即可得到MFCC參數(shù),其公式表述如下:

        其中,n=1,2,··· ,p,p為MFCC階數(shù),M為濾波器個數(shù)。

        通常MFCC參數(shù)只表述信號的靜態(tài)特征,而差分梅爾頻率倒譜系數(shù)則表征信號的動態(tài)特征。一階差分及二階差分梅爾倒譜系數(shù)計算過程分別如下所示:

        其中,C(n)為第n幀MFCC 系數(shù),D(n)為第n幀一階差分梅爾頻率倒譜系數(shù),D′(n)為第n幀二階差分梅爾頻率倒譜系數(shù)。上述三者共同構(gòu)成幀特征向量,即

        1.2 長短時記憶(LSTM)模型

        圖2 LSTM 基本結(jié)構(gòu)單元Fig.2 Basic structural unit of LSTM

        長短時記憶(LSTM)網(wǎng)絡(luò)[12]是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn)形式,其基本單元被稱為記憶塊,由一個中心節(jié)點(diǎn)和3個門控單元組成。中心節(jié)點(diǎn)通常被稱為記憶細(xì)胞,用以存儲當(dāng)前網(wǎng)絡(luò)狀態(tài),3 個門控單元分別被稱作輸入門、輸出門和遺忘門,用以控制記憶塊內(nèi)的信息流動。在前向傳播過程中,輸入門用以控制輸入到記憶細(xì)胞的信息流,輸出門用以控制記憶細(xì)胞到網(wǎng)絡(luò)其他結(jié)構(gòu)單元的信息流;在反向傳播過程中,輸入門用以控制迭代誤差流出記憶細(xì)胞,輸出門用以控制迭代誤差流入記憶細(xì)胞。而遺忘門則用以控制記憶細(xì)胞內(nèi)部的循環(huán)狀態(tài),決定信息的取舍或遺忘。通過這種門控機(jī)制,LSTM網(wǎng)絡(luò)得以控制單元內(nèi)的信息流動,使其具備了保存長時間信息的能力,即“記憶”能力,并使其在訓(xùn)練過程中能夠防止內(nèi)部梯度受外部干擾,避免了梯度彌散和梯度爆炸問題,其基本結(jié)構(gòu)單元如圖2所示[16]。

        設(shè)單個LSTM記憶塊的輸入向量為xt,輸出向量為yt,前向傳播公式可表述為[17]

        (1)長期記憶單元Ct更新過程

        其中,ft代表遺忘門,it代表輸入門。在每一個時刻,遺忘門會控制上一時刻記憶的遺忘程度,而輸入門則控制新記憶寫入長期記憶的程度。ft、it、都是與上一時刻的短期記憶ht?1和當(dāng)前時刻輸入xt相關(guān)的函數(shù),其中,σ是sigmoid 函數(shù),取值范圍[0,1],tanh 函數(shù)取值范圍[?1,1]。另外,式(8)~(10)中Wf、Wi、Wc分別為遺忘門、輸入門及Ct更新過程的權(quán)重參數(shù),bf、bi、bc分別為這三個過程對應(yīng)的偏置參數(shù)。

        (2)短期記憶單元ht更新過程

        其中,ot表示輸出門,控制著短期記憶如何受長期記憶影響,式(12)~(13)中Wo、bo分別為輸出門的權(quán)重和偏置參數(shù)。

        1.3 MFCC特征智能識別分類

        由于門控機(jī)制的作用,使LSTM 細(xì)胞單元具備“記憶”能力,因此常被用來處理帶有時間序列性質(zhì)的問題,如語音識別、自然語言處理等。水下聲目標(biāo)信號同樣帶有時間序列特性,另外,經(jīng)分幀處理獲取的MFCC 特征數(shù)據(jù)之間存在時空連續(xù)性。因此,本文將獲取的噪聲信號MFCC 特征數(shù)據(jù)作為LSTM輸入向量,通過有監(jiān)督預(yù)訓(xùn)練LSTM 模型,得到網(wǎng)絡(luò)模型參數(shù)最優(yōu)解并保存,用以對未知類別噪聲信號進(jìn)行識別分類,其流程圖如圖3所示。

        圖3 MFCC 智能識別分類流程圖Fig.3 Intelligent recognition process of MFCC

        對水下聲目標(biāo)信號樣本作分幀處理,依據(jù)公式(1)~(7)MFCC 特征提取過程,獲取各幀包含36個特征參數(shù)的MFCC 特征向量Tn,這36 個特征參數(shù)由12 個MFCC 參數(shù)、12 個一階差分梅爾頻率倒譜系數(shù)和12 個二階差分梅爾頻率倒譜系數(shù)共同組成;按各幀時間先后順序,生成各樣本MFCC 特征數(shù)據(jù)D作為LSTM網(wǎng)絡(luò)輸入向量,

        其中,m為幀數(shù)。

        基于MFCC 特征的智能識別分類方法主要包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、預(yù)測分類幾個功能模塊。

        通過前期數(shù)據(jù)預(yù)處理過程,獲取目標(biāo)噪聲的MFCC 特征向量,采用基于時間的反向傳播(Back propagation trough time, BPTT)算法,對LSTM網(wǎng)絡(luò)展開訓(xùn)練,通過逐步減小模型輸出與理論輸出誤差,得到網(wǎng)絡(luò)模型參數(shù)最優(yōu)解,最終訓(xùn)練好的網(wǎng)絡(luò)模型可用于對未知目標(biāo)噪聲的識別分類。該識別分類過程全程不需要人的參與,通過對水下無人平臺加裝具備MFCC 特征提取及LSTM 識別分類能力的信號處理設(shè)備,將聲學(xué)傳感器實(shí)時獲取的水下聲信號進(jìn)行MFCC 特征提取,獲取初始特征向量,作為LSTM 預(yù)測分類模型的輸入,經(jīng)模型的預(yù)測分類過程,可實(shí)時獲取所探測目標(biāo)的類別屬性。

        2 模型驗(yàn)證

        為驗(yàn)證上述模型的有效性,本文使用實(shí)際水下聲目標(biāo)信號進(jìn)行了驗(yàn)證。其中,訓(xùn)練樣本時長為1 s,經(jīng)分幀后獲取MFCC特征參數(shù)維數(shù)為3861,幀長設(shè)置為25 ms,幀移為10 ms。本文僅針對水面、水下兩類目標(biāo)進(jìn)行分類,屬于二分類問題,深度學(xué)習(xí)模型采用LSTM 網(wǎng)絡(luò),其相關(guān)參數(shù)設(shè)置如表1所示。

        表1 網(wǎng)絡(luò)相關(guān)參數(shù)Table1 Related parameters of the network

        圖4 訓(xùn)練數(shù)據(jù)分類效果圖Fig.4 Classification of Training data

        模型訓(xùn)練數(shù)據(jù)庫包含各種已知類別的艦船輻射噪聲數(shù)據(jù)近1600條,按1 s 時長進(jìn)行處理,MFCC特征數(shù)據(jù)作為LSTM 識別分類模型的樣本庫數(shù)據(jù),樣本總數(shù)為65284,其中水面目標(biāo)樣本數(shù)42375,水下目標(biāo)樣本數(shù)22909。為驗(yàn)證模型的有效性,避免因單次結(jié)果導(dǎo)致的錯誤結(jié)論,本文采用交叉驗(yàn)證的方式獲取訓(xùn)練樣本集,即從樣本庫中隨機(jī)選取一定比例樣本生成多組訓(xùn)練集,通過綜合分析多組訓(xùn)練集條件下的模型結(jié)果得到可靠結(jié)論,本文該比例為4/5。同時,為避免訓(xùn)練樣本出現(xiàn)有偏性估計問題,在抽取訓(xùn)練樣本時,兩類目標(biāo)訓(xùn)練樣本數(shù)同樣滿足此比例,即隨機(jī)抽取水面目標(biāo)、水下目標(biāo)各4/5的樣本組成訓(xùn)練集,最終測試結(jié)果如表2所示。圖4為模型訓(xùn)練完成后,各組訓(xùn)練數(shù)據(jù)分類效果圖。

        表2 測試結(jié)果Table2 Test results

        由上述結(jié)果可以看出,該水下目標(biāo)識別分類方法在本文所采用幾組測試集條件下,對水面目標(biāo)的識別分類正確率在86%以上,對水下目標(biāo)的識別分類正確率在87%以上,說明本文提出的基于MFCC的水下目標(biāo)識別分類方法是可行的。另外,識別分類過程僅需要輸入水下聲目標(biāo)聲壓數(shù)據(jù),其間數(shù)據(jù)處理、分類識別都不經(jīng)人工干預(yù),因此該方法可應(yīng)用于水下無人平臺對水下目標(biāo)進(jìn)行智能化識別分類。

        3 結(jié)論

        本文針對未來水下無人平臺智能化識別分類水下目標(biāo)的需求,提出了一種基于梅爾倒譜系數(shù)特征和長短時記憶網(wǎng)絡(luò)的水下聲目標(biāo)智能識別分類方法,該方法通過提取水下聲目標(biāo)的MFCC特征系數(shù)作為深度學(xué)習(xí)模型輸入向量,有監(jiān)督訓(xùn)練LSTM模型,以實(shí)現(xiàn)對未知目標(biāo)噪聲進(jìn)行識別分類。經(jīng)驗(yàn)證表明,該模型能夠有效地區(qū)分水面和水下兩類目標(biāo),且具備一定的智能識別分類能力。

        猜你喜歡
        特征提取分類記憶
        分類算一算
        基于Gazebo仿真環(huán)境的ORB特征提取與比對的研究
        電子制作(2019年15期)2019-08-27 01:12:00
        分類討論求坐標(biāo)
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        記憶中的他們
        一種基于LBP 特征提取和稀疏表示的肝病識別算法
        兒時的記憶(四)
        兒時的記憶(四)
        記憶翻新
        海外文摘(2016年4期)2016-04-15 22:28:55
        按摩女内射少妇一二三区| 天天天天躁天天爱天天碰| 国产成人www免费人成看片| 被欺辱的高贵人妻被中出| 日本黄色高清视频久久| 森中文字幕一区二区三区免费| 国产尤物av尤物在线观看| 伊人久久大香线蕉免费视频| 亚洲一区二区三区在线| 穿着白丝啪啪的av网站| 欧美私人情侣网站| 欧美成人激情在线| 人妻精品人妻一区二区三区四五 | 亚洲精品乱码久久久久99| 亚洲熟妇一区二区蜜桃在线观看| 永久免费中文字幕av| 人妻少妇久久中中文字幕| 国产又a又黄又潮娇喘视频| 国产婷婷丁香久久综合| 久久夜色精品国产九色| 日本h片中文字幕在线| 少妇高潮惨叫正在播放对白| 色综合久久精品中文字幕| 久久精品人妻一区二三区| 日本少妇浓毛bbwbbwbbw| 亚洲av成本人无码网站| 精品人妻中文字幕一区二区三区| 亚洲久悠悠色悠在线播放| 成人精品一区二区三区中文字幕| 99热成人精品国产免国语的| 少妇人妻系列中文在线| 国产精品无码av无码| 77777亚洲午夜久久多人| 在线不卡中文字幕福利| 成人性生交大片免费入口| 久久99热久久99精品| 91精品国产综合久久青草| 一本色道久久亚洲av红楼| 无人区一码二码三码四码区| 999国产精品视频| 亚洲一区二区三区精彩视频|