亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于稀疏堆疊降噪自編碼器深層神經(jīng)網(wǎng)絡(luò)的語音DOA估計算法

        2021-04-27 00:25:14郭業(yè)才
        實(shí)驗(yàn)室研究與探索 2021年3期
        關(guān)鍵詞:麥克風(fēng)聲源信噪比

        郭業(yè)才,侯 坤

        (1.南京信息工程大學(xué)電子與信息工程學(xué)院,南京 210044;2.江蘇省大氣環(huán)境與裝備技術(shù)協(xié)同創(chuàng)新中心,南京 210044;3.南京信息工程大學(xué)濱江學(xué)院,江蘇無錫 214105)

        0 引言

        波達(dá)方位(Direction of Arrival,DOA)估計是通過信號的空間特征參數(shù),確定信號在空間域中的位置信息,如距離、方位角、俯仰角等[1-6]。聲源定位技術(shù)是波達(dá)方位估計的一種重要手段,其中多重信號分類(Multiple Signal Classification,MUSIC)算法[7]和旋轉(zhuǎn)不變性子空間(Estimating Signal Parameter Via Rotational Invariance Techniques,ESPRIT)算法[8]是傳統(tǒng)的DOA技術(shù)。它們在低信噪比環(huán)境下定位誤差大。隨著計算機(jī)技術(shù)的發(fā)展和智能算法的出現(xiàn),聲源定位技術(shù)得到了發(fā)展。文獻(xiàn)[9]中提出基于局部保持投影和徑向基(Radial Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)的DOA估計算法,利用局部保持投影對神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本進(jìn)行降維,加快了神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,但定位精度不高;文獻(xiàn)[10]中提出從廣義互相關(guān)(Generalized Cross Correlation,GCC)向量中提取方位特征送入多層感知器(Multi-layerperceptron,MLP)網(wǎng)絡(luò)學(xué)習(xí)的DOA估計算法定位準(zhǔn)確,但抗噪性較差。

        1 DOA 估計模型[11-12]

        假設(shè)空間中有M個陣元組成的線性均勻陣列,窄帶聲源信號為θi(i∈[1,2,…,k]),每個信號源互不相干的入射到麥克風(fēng)陣列上,第m個麥克風(fēng)接收的信號為

        式中:m =1,2,…,M;δm為第m個陣元對信號的增益;s(t)為t時刻聲源入射信號;τm為第m個陣元接收聲源信號相對于參考陣元的時延;vm(t)為t時刻第m個陣元的噪聲。式(1)的矩陣形式為

        式中:A為信號的導(dǎo)向向量。假設(shè)噪聲均值為0、方差為σ2的高斯白噪聲,則麥克風(fēng)陣列接收信號的協(xié)方差矩陣為

        式中:*表示共軛。R的矩陣形式為

        將協(xié)方差矩陣R的上三角陣中元素的實(shí)部、虛部分開后作為SSDAE-DNN的輸入,即

        式中:Re(·)為取實(shí)部;Im(·)為取虛部。

        2 SSDAE-DNN網(wǎng)絡(luò)框架

        本文網(wǎng)絡(luò)框架由SSDAE與DNN網(wǎng)絡(luò)組成,如圖1所示。通過SSDAE網(wǎng)絡(luò)進(jìn)行抗噪訓(xùn)練,將訓(xùn)練得到的最優(yōu)權(quán)重遷移給DNN網(wǎng)絡(luò)作為輸出訓(xùn)練權(quán)重,通過損失函數(shù)優(yōu)化DNN網(wǎng)絡(luò)模型,建立語音信號特征yn和方位角θ之間的非線性映射關(guān)系。將語音DOA估計問題視作分類問題,通過SSDAE-DNN網(wǎng)絡(luò)對yn進(jìn)行分類,根據(jù)分類結(jié)果選取對應(yīng)的角度標(biāo)簽,實(shí)現(xiàn)對方位角θ的估計。

        圖1 SSDAE-DNN網(wǎng)絡(luò)結(jié)構(gòu)

        2.1 堆疊稀疏自編碼器

        文獻(xiàn)[13-15]中提出的去噪自編碼器(De-noising Self Encoder,DAE),由輸入層、隱藏層和輸出層組成。在DAE的損失函數(shù)中加入稀疏因子ρ就構(gòu)成稀疏去噪自編碼器(Sparse De-noising Self-encoder,SDAE)。SDAE同時具有稀疏性和魯棒性,網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。

        日前,在美國舉行的世界啤酒品評大賽“世界啤酒錦標(biāo)賽”中,青島黑啤以出色的口味與品質(zhì)征服評委味蕾,一路“過關(guān)斬將”奪得金獎。無獨(dú)有偶,11月14日,“2018歐洲啤酒之星”大賽頒獎儀式在德國南部城市紐倫堡會展中心舉行,青島啤酒皮爾森從來自全球51個國家、2344款啤酒產(chǎn)品中脫穎而出,榮獲“歐洲啤酒之星”大獎。

        圖2 SDAE算法流程圖

        預(yù)處理過的訓(xùn)練樣本yn分配給輸入層,隱藏層單元為

        式中:Z為隱藏層單元數(shù);W∈RM×N為編碼器權(quán)重矩陣;be為編碼偏置。輸出層單元為:

        式中:f(·)為非線性激活函數(shù);WT∈RM×N為解碼器權(quán)重;bd為解碼偏置。SDAE網(wǎng)絡(luò)的損失函數(shù)為

        式中:NT為數(shù)據(jù)集數(shù)量;β為超參數(shù),其值在訓(xùn)練過程中通過調(diào)整最優(yōu)參數(shù)時決定;KL為Kullback-Leibler散度;ρz為第z個隱藏單元的平均激活度,且

        SSDAE網(wǎng)絡(luò)由多個SDAE堆疊而成,前一個SDAE隱藏層的輸出作為下一個SDAE的輸入,網(wǎng)絡(luò)結(jié)構(gòu)如圖3示。

        圖3 SSDAE網(wǎng)絡(luò)結(jié)構(gòu)

        SSDAE網(wǎng)絡(luò)采用貪婪逐層進(jìn)行訓(xùn)練,單獨(dú)訓(xùn)練每一個SDAE網(wǎng)絡(luò)得到最優(yōu)權(quán)值后作為SSDAE網(wǎng)絡(luò)的初始權(quán)值,通過反向傳播(BP)整體微調(diào),直至得到最優(yōu)參數(shù),微調(diào)階段的損失函數(shù)為與式(10)相比,式(13)無稀疏約束項(xiàng),是由于訓(xùn)練單個SDAE時已包括稀疏約束。

        用SSDAE網(wǎng)絡(luò)對語音定位進(jìn)行預(yù)訓(xùn)練時,添加了抗噪訓(xùn)練,優(yōu)化了特征選擇,稀疏因子ρ將包含無用信息的特征權(quán)重置為0,降低了訓(xùn)練復(fù)雜度,提升了算法的抗噪性能與收斂速度,且可從有限的樣本中提取到更多的特征信息。

        2.2 DNN網(wǎng)絡(luò)框架

        本文采用的DNN網(wǎng)絡(luò)如圖1(b)所示,有3層全連接隱藏層。將SSDAE網(wǎng)絡(luò)預(yù)訓(xùn)練模型的最優(yōu)權(quán)值作為DNN的初始權(quán)值,減少了DNN網(wǎng)絡(luò)模型的訓(xùn)練時間。同時,因SSDAE網(wǎng)絡(luò)在編碼過程中加入了高斯白噪聲進(jìn)行抗噪訓(xùn)練,采取遷移策略遷移權(quán)重后,一定程度上提升了DNN網(wǎng)絡(luò)的抗噪性能。通過3層全連接隱藏層強(qiáng)化特征提取和非線性映射能力,建立DNN學(xué)習(xí)特征與DOA估計之間的非線性映射關(guān)系,獲得一個抗噪性強(qiáng)的穩(wěn)健DOA估計系統(tǒng)。隱藏層為

        式中,l為隱藏層的層數(shù),l∈{1,2,3}。

        DNN網(wǎng)絡(luò)框架的損失函數(shù)為

        2.3 性能評價指標(biāo)

        以均方根誤差(Root Mean Square Error,RMSE)作為算法性能評價指標(biāo),比較本文算法、基于多層感知器(Multilayerperceptron,MLP)、徑向基函數(shù)(Radial Basis Function,RBF)和MUSIC的DOA估計算法的準(zhǔn)確性和穩(wěn)定性。RMSE定義為

        式中,θi、分別為真實(shí)值與估計值。

        3 算法仿真

        3.1 仿真條件

        房間尺寸為5.5 m ×3.3 m ×2.3 m,麥克風(fēng)陣列陣元間距為5 cm,第一個陣元為參考陣元,聲源與麥克風(fēng)相距1.5 m,均勻陣列的高度為1.2 m,如圖4所示。房間內(nèi)墻面(普通石灰墻)的反射系數(shù)為0.95,地板的反射系數(shù)為0.90,麥克風(fēng)陣元個數(shù)為8。

        圖4 仿真條件示意圖(m)

        數(shù)據(jù)集聲源信號取為純凈語音信號,入射角度為0.1°,信號遍歷各個分組的定位范圍,按8∶2的比例隨機(jī)抽取制作訓(xùn)練集和數(shù)據(jù)集,數(shù)據(jù)集規(guī)模約為3.6×104個。將音響放置在參考陣元的四周作為聲源,實(shí)驗(yàn)數(shù)據(jù)由一個8陣元線性麥克風(fēng)陣列采集。

        3.2 迭代時間對比

        以基于SSDAE-DNN、MLP和RBF神經(jīng)網(wǎng)絡(luò)的DOA估計算法為互比對象,分別使用4 500、9 000和18 000個訓(xùn)練樣本。3種算法的運(yùn)行時間見表1。表1表明,基于SSDAE-DNN和MLP網(wǎng)絡(luò)的DOA估計算法的運(yùn)行速度遠(yuǎn)遠(yuǎn)快于基于RBFNN網(wǎng)絡(luò)的DOA估計算法,而本文算法的運(yùn)行速度又快于基于MLP網(wǎng)絡(luò)的DOA算法。

        表1 3種算法的運(yùn)行時間 s

        3.3 信噪比對系統(tǒng)性能的影響

        在不同信噪比下,比較基于SSDAE-DNN、MUSIC、MLP和RBFNN的DOA估計算法的抗噪性能。信噪比范圍為-5~15 dB,其余仿真條件與前面相同。圖5表明,3種DOA估計算法的RMSE均隨信噪比增大而逐漸減小,而本文算法的RMSE均小于其他算法,有更好的精確性和抗噪性。

        圖5 信噪比對系統(tǒng)性能的影響

        圖6 陣元數(shù)對系統(tǒng)性能的影響

        3.4 陣元數(shù)對系統(tǒng)性能的影響

        在不同陣元數(shù)下,比較基于SSDAE-DNN、MUSIC、MLP和RBFNN的DOA估計算法的RMSE。麥克風(fēng)陣元個數(shù)分別為4、6、8、10和12,其余仿真條件與前面相同。圖6表明,3種算法的RMSE均隨陣元個數(shù)及輸入網(wǎng)絡(luò)特征個數(shù)增加而逐漸降低且變化也趨于平緩,而本文算法的RMSE在4個陣元時大于基于RBF的DOA估計算法,但隨著陣元個數(shù)的增加,RMSE逐漸減小且小于其他算法。

        4 結(jié)語

        針對低信噪比時傳統(tǒng)的DOA估計算法定位誤差大問題,提出了基于SSDAE-DNN神經(jīng)網(wǎng)絡(luò)的語音DOA估計算法。該算法通過SSDAE增強(qiáng)了網(wǎng)絡(luò)框架的抗噪性能,通過遷移學(xué)習(xí)轉(zhuǎn)移權(quán)重提升了DNN網(wǎng)絡(luò)框架的泛化性。仿真與實(shí)驗(yàn)結(jié)果表明,在低信噪比下,本文算法的性能上優(yōu)于基于MLP、RBF和MUSIC的DOA估計算法。

        猜你喜歡
        麥克風(fēng)聲源信噪比
        虛擬聲源定位的等效源近場聲全息算法
        基于深度學(xué)習(xí)的無人機(jī)數(shù)據(jù)鏈信噪比估計算法
        Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
        基于GCC-nearest時延估計的室內(nèi)聲源定位
        電子制作(2019年23期)2019-02-23 13:21:12
        基于數(shù)字麥克風(fēng)的WIFI語音發(fā)射機(jī)
        電子測試(2018年23期)2018-12-29 11:11:24
        低信噪比下LFMCW信號調(diào)頻參數(shù)估計
        電子測試(2018年11期)2018-06-26 05:56:02
        低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
        麥克風(fēng)的藝術(shù)
        運(yùn)用內(nèi)積相關(guān)性結(jié)合迭代相減識別兩點(diǎn)聲源
        麥克風(fēng)
        免费看黄在线永久观看| 又大又粗弄得我出好多水| 国产亚洲女在线线精品| 久久精品国产精品亚洲婷婷| 日本av一级片免费看| 国产精品免费_区二区三区观看| 乌克兰少妇xxxx做受6| 久久久99久久久国产自输拍| 激情五月天色婷婷久久| 欧美大片aaaaa免费观看| 国产在线精品一区二区不卡| 国产成人亚洲综合小说区| 日韩在线不卡一区三区av| 成人午夜福利视频| 久久人人97超碰超国产| 中文字幕麻豆一区二区| 亚洲中文字幕乱码第一页| 97在线观看视频| 精品午夜久久网成年网| 手机在线看片在线日韩av| 人妻精品在线手机观看| 欧美国产精品久久久乱码| 精品视频专区| 美女被内射很爽的视频网站| 一本丁香综合久久久久不卡网站| 夜夜爽一区二区三区精品| 精品国产日韩无 影视| 国产精品国产三级久久| 亚洲国产精品综合久久网各| 精品无码av不卡一区二区三区| 日本一区二区日韩在线| 久久黄色视频| 久久中文精品无码中文字幕| 视频女同久久久一区二区三区| 亚洲精品视频1区2区| 午夜成人鲁丝片午夜精品| 视频在线观看一区二区三区| 亚洲一区中文字幕一区| 男女做爰高清免费视频网站| 亚洲一区二区三区在线网站| 精品专区一区二区三区|