亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于稀疏表示和特征加權(quán)的離格雙耳聲源定位?

        2019-12-04 07:41:22丁建策劍鄭成詩李曉東
        應(yīng)用聲學(xué) 2019年6期
        關(guān)鍵詞:混響雙耳頻點

        丁建策 厲 劍鄭成詩 李曉東

        (1中國科學(xué)院聲學(xué)研究所噪聲與振動重點實驗室 北京 100190)

        (2中國科學(xué)院大學(xué) 北京 100049)

        0 引言

        雙耳聲源定位利用耳道入口或者耳道內(nèi)的傳聲器接收到的聲信號來估計空間中聲源的方位。它在虛擬聲重放[1]、助聽器[2]、智能音視頻會議[3]等領(lǐng)域有著廣泛的應(yīng)用,研究雙耳聲源定位有著重要的科學(xué)意義和研究價值。

        雙耳聲源定位算法中最常用的兩種雙耳特征分別為雙耳時間差(Interaural time difference,ITD)和雙耳聲級差(Interaural level difference,ILD)。一般而言,ITD適用于中低頻的聲源定位,ILD適用于高頻的聲源定位。在Jeffress[4]提出雙耳“巧合假說”模型(coincident theory)之后,研究者們提出了一系列雙耳聲源定位算法。常用的雙耳聲源定位算法有兩類:一類是基于頭相關(guān)傳遞函數(shù)(Head-related transfer function,HRTF)的雙耳聲源定位方法[5-6],另一類是基于機器學(xué)習(xí)的監(jiān)督式雙耳聲源定位方法[7-8]?;贖RTF的雙耳聲源定位方法的一般做法是:提取觀測雙耳信號的雙耳特征(如ITD、ILD等)和HRTF數(shù)據(jù)庫中各個離散測量方位角對應(yīng)的雙耳特征,然后進行匹配定位。這類方法計算量小,適用范圍廣,然而在低信噪比或強混響環(huán)境下其定位性能會嚴重下降。監(jiān)督式雙耳聲源定位方法通過機器學(xué)習(xí)方法訓(xùn)練聲源方位角與雙耳特征之間的關(guān)系,通常有著較高的定位準(zhǔn)確率。這類算法需要預(yù)先構(gòu)建訓(xùn)練數(shù)據(jù)庫,訓(xùn)練過程計算復(fù)雜度高,而且在訓(xùn)練條件與測試條件不匹配的情況下定位性能會嚴重下降。本文重點研究基于HRTF的雙耳聲源定位方法。

        在基于HRTF的雙耳聲源定位方法中,聲源的方位角估計結(jié)果往往被限定在HRTF數(shù)據(jù)庫的離散測量點上。當(dāng)聲源真實方位角與HRTF數(shù)據(jù)庫的測量方位角不一致時,算法的定位性能會顯著下降,這就是雙耳聲源定位中的離格問題。HRTF數(shù)據(jù)庫的測量方位角間隔一般比較大(不小于5°),因此離格問題對基于HRTF的雙耳聲源定位算法的影響不可忽視。隨著壓縮感知技術(shù)的興起,研究者們提出了一系列離格稀疏重建方法來解決陣列到達角(Direction of arrival,DOA)估計中的離格問題。2013年,Yang等[9]提出了稀疏貝葉斯學(xué)習(xí)(Sparse Bayesian learning,SBL)方法來解決窄帶信號DOA估計中的離格問題。2017年,高陽等[10]提出了基于酉變換的實數(shù)域稀疏貝葉斯學(xué)習(xí)方法,有效降低了離格DOA估計方法的運算量。同年,胡順仁等[11]提出了一種聯(lián)合稀疏貝葉斯理論和子空間方法的近場聲源定位算法,用于解決近場信號源的DOA估計問題。由于頭和軀干的陰影效應(yīng)的影響,雙耳信號與陣列信號的聲傳播模型有所不同,因此上述這些離格陣列DOA估計算法都不能直接用于解決雙耳聲源定位中的離格問題。

        為了解決雙耳聲源定位中的離格問題,本文提出一種基于加權(quán)寬帶稀疏貝葉斯學(xué)習(xí)的離格雙耳聲源定位方法(Off-grid binaural sound source localization based on weighted wideband sparse Bayesian learning,WWSBL-OGBSSL)。首先建立離格雙耳信號的稀疏信號模型,將離格雙耳聲源定位問題轉(zhuǎn)化為一個凸優(yōu)化問題,然后基于雙耳相干與擴散能量比(Binaural coherent-to-diffuse power ratio,BCDR)特征對雙耳信號的各個頻點進行加權(quán)以降低噪聲和混響的影響,最后利用加權(quán)寬帶稀疏貝葉斯學(xué)習(xí)方法來估計離格聲源的方位角。WWSBL-OGBSSL算法通過離格稀疏信號模型將聲源方位角和測量方位角之間的偏離值作為估計參數(shù)進行迭代運算,有效提高了離格聲源的方位角估計準(zhǔn)確率。仿真和實際實驗結(jié)果表明,和現(xiàn)有的基于HRTF的雙耳聲源定位方法相比,WWSBLOGBSSL算法在各種復(fù)雜的聲學(xué)環(huán)境下都有著更高的定位精度和更強的魯棒性,特別是提高了離格情況下的雙耳聲源定位性能。

        本文常用的符號如下:x、xT和xH分別表示x的共軛、轉(zhuǎn)置和共軛轉(zhuǎn)置;AP×Q表示一個P×Q的矩陣,0P×Q表示P×Q的全零矩陣,IP表示一個P×P的單位矩陣,diag(x)表示一個對角矩陣,其對角線的元素與向量x的元素相同;tr(A)表示矩陣A的跡,(A)ij表示矩陣A中的(i,j)元素值。‖AP×Q‖1和‖AP×Q‖22分別表示AP×Q的L1范數(shù)和L2范數(shù);C表示復(fù)數(shù)集。

        1 信號模型

        1.1 離格雙耳信號的稀疏表示模型

        假設(shè)s(n)為點聲源,xl(n)和xr(n)分別為左右耳傳聲器采集到的聲信號。研究表明,聲源到雙耳內(nèi)傳聲器的房間傳遞函數(shù)與聲源到傳聲器的距離、聲源的方位角和俯仰角密切相關(guān)[12]。本文只考慮遠場聲源水平面方位角定位問題,此時雙耳信號xl|r(n)(xl(n)或xr(n))可表示為

        其中,“?”為卷積運算符,hl|r(θ)為聲源到達左右耳(左耳或右耳)傳聲器的房間脈沖響應(yīng),θ為聲源的方位角,vl|r(n)為左右耳傳聲器接收到的環(huán)境噪聲。在頻域中,式(1)可表示為

        其中,Xl|r,k(m)、Hl|r,k(θ)、Sk(m)、Vl|r,k(m)分別為xl|r(n)、hl|r(θ)、s(n)、vl|r(n)第m幀NSTFT點短時傅里葉變換(Short-time Fourier transform,STFT)第k個頻率分量,k∈{0,1,···,K-1},K為頻點總數(shù)。

        聲源方位角θ對應(yīng)的導(dǎo)向矢量可定義為ak(θ)=[Hl,k(θ)/Hr,k(θ),1]T,那么式(2)可近似為

        其中,Xk(m)=[Xl,k(m),Xr,k(m)]T,Vk(m)=[Vl,k(m),Vr,k(m)]T。

        假設(shè)HRTF數(shù)據(jù)庫在人工頭前半水平面內(nèi)包含J個等間隔分布的測量方位角,為方位角間隔為δ。若聲源方位角θ滿足且那么該聲源為在格聲源,對應(yīng)的雙耳信號為在格雙耳信號;{若聲源方位角θ位}于測量方位角之間,即,那么該聲源為離格聲源,對應(yīng)的雙耳信號為離格雙耳信號。利用HRTF數(shù)據(jù)庫中的頭相關(guān)脈沖響應(yīng)(Head-related impulse responses,HRIRs)可計算出每個測量方位角對應(yīng)的導(dǎo)向矢量由此雙耳聲源定位中的字典矩陣可表示為

        其中,bk(θp)為ak(p)的一階偏導(dǎo)數(shù)。定義一個偏導(dǎo)數(shù)矩陣和一個偏移矢量其中,

        那么包含離格偏移參數(shù)的離格字典矩陣可表示為

        進一步定義一個稀疏系數(shù)向量Yk(m)=其中,

        那么,離格雙耳信號的稀疏表示模型為

        由于聲源方位角θ為未知量,因此稀疏系數(shù)向量Yk(m)和方位角偏移矢量β都是未知量?;诼曉吹目臻g稀疏性,可將式(8)中的離格聲源方位角估計問題轉(zhuǎn)化為一個凸優(yōu)化問題,并通過稀疏重建方法[13]估計Yk(m)和β。離格聲源方位角估計問題可簡化為

        其中,λ為常量,表示拉格朗日乘子。

        圖1 離格雙耳聲源定位示意圖Fig.1 Off-grid binaural sound source localization

        1.2 導(dǎo)向矢量模型

        其中,fs為信號采樣率,為虛數(shù)單位。根據(jù)文獻[5],和與測量方位角之間的關(guān)系可近似為以下參數(shù)模型:

        其中,ξk和?k為與頻率有關(guān)的參數(shù),d為雙耳內(nèi)傳聲器之間的距離,c為空氣中的聲速。ξk和?k可通過最小均方(Least square,LS)算法計算得出[5]。將式(11)和式(12)代入到式(10)中,并對其求導(dǎo),可得

        1.3 基于雙耳相干與擴散能量比的加權(quán)方法

        與現(xiàn)有的基于HRTF的雙耳聲源定位算法類似,若直接采用稀疏重構(gòu)方法求解式(9)中的離格雙耳聲源定位問題,那么算法的性能在噪聲或混響條件下會顯著下降[5-6]。研究表明,利用雙耳相干與擴散能量比(BCDR)特征對各頻點雙耳特征進行加權(quán)處理可以明顯提高噪聲或混響條件下雙耳聲源定位算法的性能[14-15]。因此本文進一步提出利用BCDR特征對各個頻點的雙耳信號進行加權(quán)以降低噪聲和混響的影響。

        在一般聲場中,雙耳信號可以分為相干信號成分xl|r,ss(n)和擴散信號成分xl|r,dd(n)。在BSSL中,聲源角度是未知量,因此本文根據(jù)雙耳信號xl|r(n)的相干函數(shù)Γxx,k(m)和擴散信號xl|r,dd(n)的相干函數(shù)Γdd,k(m)來估計BCDR。xl|r(n)的相干函數(shù)Γxx,k(m)可以表示為

        其中,(·)?表示取共軛,E{·}為期望函數(shù)。Lindevald等[16]的研究表明,遠場條件下房間內(nèi)xl|r,dd(n)的相干函數(shù)Γdd,k(m)與幀數(shù)m無關(guān),可以近似為

        其中,fk=k·fs/2(K-1)。那么BCDR的無偏估計公式為[17]

        其中,R{·}表示取實部。定義加權(quán)系數(shù)Wk(m)為

        2 基于加權(quán)寬帶稀疏貝葉斯學(xué)習(xí)的離格雙耳聲源定位算法

        在多測量矢量(Multiple measurement vector,MMV)模型下,本節(jié)推導(dǎo)加權(quán)寬帶稀疏貝葉斯學(xué)習(xí)算法(WWSBL),用于解決式(18)的凸優(yōu)化問題,從而實現(xiàn)離格聲源方位角的估計。

        在MMV模型下,經(jīng)過特征加權(quán)后的離格雙耳信號的稀疏表示模型為

        為了估計稀疏系數(shù)矩陣YJ×M k和方位角偏移矢量β,需要已知二者的先驗概率分布。在高斯混合模型下,假設(shè)每幀信號各個頻率分量對應(yīng)的稀疏系數(shù)向量Yk(m)相互獨立,且符合同一復(fù)高斯分布Yk(m)~CN(0J×1,ΛJ×J),其中,協(xié)方差矩陣ΛJ×J=diag(α)為一個對角矩陣,α=[α1,···,αj,···,αJ]為Yk(m)中各個元素的方差。根據(jù)高斯分布的性質(zhì),αj的先驗概率分布可假設(shè)為獨立同分布的Gamma分布。稀疏系數(shù)矩陣以及α的先驗概率密度函數(shù)可表示為

        其中,γ為Gamma分布的參數(shù)。方位角偏移矢量β中各個元素的先驗分布可假設(shè)為相互獨立的均勻分布,那么β的先驗概率分布可表示為

        綜上,WWSBL算法中的待估參數(shù)如下:

        根據(jù)文獻[9],式(24)中的模型參數(shù)可通過期望最大化(Expectation maximization,EM)算法進行求解。WWSBL中的EM算法將稀疏系數(shù)矩陣作為一個隱含變量處理,即優(yōu)化過程中不再出現(xiàn)而將參數(shù)α和偏移向量β作為優(yōu)化對象,通過最大化

        來估計各個參數(shù)的最佳值。各個參數(shù)的迭代更新公式如下:

        其中,μk(m)和ΣJ×Jk分別為Yk(m)后驗概率分布的均值和方差,可通過高斯混合模型推導(dǎo)計算出來。每次迭代中,更新了參數(shù)ε和α之后,再更新偏移向量β。假設(shè)αnew的第jopt個元素為αnew的最大值,那么只更新β的第jopt個元素,其他元素保持不變。偏移向量β的更新公式如下:

        偏移向量β的更新公式無法用顯式表達,可以通過遍歷法得到最優(yōu)解。

        3 實驗結(jié)果及分析

        本文分別在仿真和實際聲學(xué)環(huán)境下對WWSBL-OGBSSL算法的性能進行了測試。3.1節(jié)測試了本文算法在自由場環(huán)境下的雙耳聲源方位角估計性能,3.2節(jié)測試了本文算法在噪聲環(huán)境下的方位角估計性能,3.3節(jié)測試了本文算法在混響環(huán)境下的方位角估計性能,3.4節(jié)測試了本文算法在實際環(huán)境下的方位角估計性能。

        在自由場環(huán)境和噪聲環(huán)境下,實驗中的雙耳信號是由HRTF數(shù)據(jù)庫中的HRIRs卷積純凈語音信號生成。本文選用的HRTF數(shù)據(jù)庫為MIT HRTF數(shù)據(jù)庫[18],純凈語音信號選自TIMIT數(shù)據(jù)庫[19]。由于只考慮聲源水平角的估計,因此本文算法只采用了HRTF數(shù)據(jù)庫中前半水平面的HRIRs數(shù)據(jù)。本文將生成的雙耳信號分幀加窗后,提取ILD、ITD等雙耳特征。雙耳信號的采樣率為16 kHz,幀長為32 ms,幀移為16 ms,窗函數(shù)采用漢明窗。由于MIT HRTF數(shù)據(jù)庫使用的KEMAR人工頭半徑為7.6 cm,因此本文將ITD特征的取值范圍限定為[-1,1]ms,同時將ILD特征的取值范圍設(shè)定為[-40,40]dB??諝庵械穆曀贋?43 m/s。

        本文選取兩種現(xiàn)有的基于HRTF的雙耳聲源定位方法與WWSBL-OGBSSL算法作對比,分別為Finger等[6]提出的在線校準(zhǔn)(Online calibration,OC)算法和Liu等[20]提出的雙耳匹配濾波器(Interaural matching filter,IMF)定位算法。本文中聲源方位角估計的均方根誤差(Root mean square error,RMSE)定義如下:

        其中,L為雙耳信號數(shù)據(jù)段總數(shù),θl為第l個數(shù)據(jù)段的聲源真實方位角,為對應(yīng)的聲源方位角估計值。聲源方位角的估計準(zhǔn)確率(Accuracy,Acc)定義如下:

        其中,L|?θl-θl|≤10°為方位角估計誤差不大于10°的數(shù)據(jù)段總數(shù)。

        3.1 自由場環(huán)境下的雙耳聲源定位實驗

        本小節(jié)通過仿真實驗測試WWSBL-OGBSSL算法在自由場環(huán)境下的方位角估計性能。在前半水平面內(nèi),MIT HRTF數(shù)據(jù)庫包含37個方位角的HRIRs,分別為{-90°,-85°,···,85°,90°},方位角間隔為5°。為了仿真在格聲源和離格聲源的情況,可假設(shè)?θ={-90°,-80°,···,80°,90°}為所有的測量方位角,這些方位角對應(yīng)的HRIRs數(shù)據(jù)用于生成在格雙耳信號,其余18個方位角的HRIRs數(shù)據(jù)用于生成離格雙耳信號。測量方位角共有19個,方位角間隔δ=10°。在每個方位角下,隨機選取TIMIT數(shù)據(jù)庫的400句語音信號仿真生成400句自由場環(huán)境下的雙耳信號。首先將每個雙耳信號分成時長為1 s的數(shù)據(jù)段,并對每段雙耳信號分幀,然后基于語音端點檢測(Voice activity detection,VAD)算法去除非語音幀數(shù)據(jù)。分別采用OC算法、IMF算法和WWSBL-OGBSSL算法對每段信號進行聲源方位角估計。每段信號中語音幀的總數(shù)即為WWSBLOGBSSL算法中MMV模型的快拍數(shù)。自由場環(huán)境下的加權(quán)系數(shù)Wk(m)恒為1。圖2給出了自由場環(huán)境下三種算法對在格聲源和離格聲源的方位角估計均方根誤差(RMSE)曲線圖,“on-grid”和“off-grid”分別表示在格聲源和離格聲源,“Proposed”表示W(wǎng)WSBL-OGBSSL算法。

        從圖2中可以看出,WWSBL-OGBSSL算法對在格聲源的定位性能稍優(yōu)于OC算法和IMF算法,對離格聲源的定位性能明顯優(yōu)于OC算法和IMF算法。這是因為OC算法和IMF算法的方位角估計結(jié)果被限定在了離散測量方位角上,而WWSBLOGBSSL算法通過迭代估計出離聲源真實方位角最近的測量方位角和二者之間的偏移量,估計結(jié)果可能為聲源真實方位角附近的任意值。OC算法和IMF算法對在格聲源的方位角估計誤差為{0°,10°,20°,···},對離格聲源的方位角估計誤差為{5°,15°,25°,···},最小估計誤差為5°;而WWSBLOGBSSL對在格聲源和離格聲源的方位角估計誤差都可以為任意小的值,在理想情況下誤差可以降至0°,因此WWSBL-OGBSSL算法可以顯著提高離格條件下的雙耳聲源方位角估計性能。

        圖2 自由場環(huán)境下三種算法對在格聲源和離格聲源的方位角估計的RMSE曲線Fig.2 The RMSE of azimuth estimation of the OC,the IMF,the WWSBL-OGBSSL methods for the on-grid sound sources and the off-grid sound sources

        3.2 不同噪聲環(huán)境下的雙耳聲源定位實驗

        本實驗主要測試了WWSBL-OGBSSL算法在不同信噪比下的方位角估計性能。為了模擬噪聲環(huán)境,本實驗在3.1節(jié)自由場環(huán)境下生成的雙耳信號中加入擴散場噪聲,生成帶噪雙耳信號。本實驗中在格雙耳信號的聲源方位角為-30°,離格雙耳信號的聲源方位角為25°,其他實驗條件與3.1節(jié)相同。擴散場噪聲是由MIT HRTF數(shù)據(jù)庫中72個水平面方位角的HRIRs卷積高斯白噪聲后疊加生成的。帶噪雙耳信號的信噪比(Signal-to-noise ratio,SNR)設(shè)定為0 dB到30 dB,間隔為10 dB。本實驗采用方位角估計準(zhǔn)確率指標(biāo)來衡量三種算法對在格聲源和離格聲源的方位角估計性能。圖3給出了不同信噪比下三種算法對在格聲源和離格聲源的方位角估計準(zhǔn)確率。

        從圖3中可以看出,在不同的噪聲環(huán)境下,WWSBL-OGBSSL算法對在格聲源的方位角估計準(zhǔn)確率比OC算法和IMF算法高出3%~15%,對離格聲源的方位角估計準(zhǔn)確率比OC算法和IMF算法高出5%~20%。特別是在信噪比為0 dB時,WWSBL-OGBSSL算法對在格聲源和離格聲源的方位角估計準(zhǔn)確率分別比OC算法和IMF算法高出15%和20%左右。值得注意的是,OC算法和IMF算法對離格聲源的最小估計誤差為5°,WWSBLOGBSSL算法對離格聲源的最小估計誤差理論上可達到0°。WWSBL-OGBSSL算法基于BCDR特征對各個頻點進行加權(quán),將擴散場噪聲占主要成分的頻點去除,降低擴散噪聲對方位角估計性能的影響,有效提高了雙耳聲源方位角估計準(zhǔn)確率;同時WWSBL-OGBSSL算法基于各頻點信號能量優(yōu)化模型參數(shù),能量強的頻點具有更大的權(quán)重,從而進一步提高了噪聲環(huán)境下的方位角估計準(zhǔn)確率。

        圖3 不同信噪比下OC算法、IMF算法和WWSBL-OGBSSL算法的方位角估計準(zhǔn)確率Fig.3 The azimuth estimation accuracies of the OC,the IMF,the WWSBL-OGBSSL methods under different SNRs

        3.3 不同混響環(huán)境下的雙耳聲源定位實驗

        本小節(jié)通過仿真實驗測試了WWSBLOGBSSL算法在不同混響條件下的方位角估計性能。雙耳信號是由不同混響條件下的雙耳房間脈沖響應(yīng)(Binaural room impulse responses,BRIRs)卷積純凈語音信號生成。不同混響條件下的BRIRs是由MIT HRTF數(shù)據(jù)庫中的HRIRs經(jīng)鏡像法[21]模擬生成。混響時間分別設(shè)定為100 ms到600 ms,間隔為100 ms。本實驗中在格雙耳信號的聲源方位角為-30°,離格雙耳信號的聲源方位角為25°。圖4給出了不同混響條件下三種算法對在格聲源和離格聲源的方位角估計準(zhǔn)確率。

        圖4 不同混響條件下OC算法、IMF算法和WWSBL-OGBSSL算法的方位角估計準(zhǔn)確率Fig.4 The azimuth estimation accuracies of the OC,the IMF,the WWSBL-OGBSSL methods under different reverberation times

        從圖4中可以看出, 在不同混響條件下,WWSBL-OGBSSL算法對在格聲源和離格聲源的方位角估計準(zhǔn)確率比OC算法和IMF算法高出2%~15%。隨著混響增大,OC算法和IMF算法的方位角估計性能都會嚴重惡化,這是因為混響情況下,由于房間反射,在格雙耳信號和離格雙耳信號的雙耳特征(ILD、ITD等)與自由場環(huán)境測量的HRTF數(shù)據(jù)庫中提取的雙耳特征嚴重不匹配。WWSBL-OGBSSL算法基于BCDR對各個頻點的雙耳信號進行加權(quán),將混響占主要成分的頻點去除,有效降低了混響對方位角估計性能的影響;而且WWSBL-OGBSSL算法基于各頻點的能量對各個參數(shù)迭代更新,能量強的頻點會有更大的權(quán)重,因此在混響條件下WWSBL-OGBSSL算法的方位角估計性能更優(yōu)。

        3.4 實際環(huán)境下的雙耳聲源定位實驗

        本小節(jié)通過實際實驗測試了WWSBL-OGBSSL算法在實際環(huán)境下的方位角估計性能。本文在一個鋪設(shè)有吸聲材料的房間內(nèi)采用B&K 4128人工頭采集雙耳信號。房間的大小約為6.4 m×4.8 m×2.8 m,混響時間約為T60≈350 ms,混響半徑r0≈1.60 m。聲源位于人工頭的水平面上,距人工頭的距離為1.80 m,真實方位角分別為{-90°,-85°,···,85°,90°},方位角間隔為5°。在每個方位角處,隨機選取TIMIT數(shù)據(jù)庫的200句語音信號作為聲源信號,采集200句雙耳信號。假設(shè)?θ={-90°,-80°,···,80°,90°}為HRTF數(shù)據(jù)庫中所有的測量方位角,那么當(dāng)聲源真實方位角θ∈{-90°,-80°,···,80°,90°}時,聲源為在格聲源,當(dāng)聲源真實方位角θ∈{-85°,-75°,···,75°,85°}時,聲源為離格聲源。將每個雙耳信號劃分為時長為1 s的雙耳信號數(shù)據(jù)段,然后分別采用OC算法、IMF算法和WWSBL-OGBSSL算法估計每段信號的方位角。圖5給出了實際環(huán)境下三種算法對在格聲源和離格聲源的方位角估計準(zhǔn)確率。

        圖5 實際環(huán)境下OC算法、IMF算法和WWSBLOGBSSL算法的方位角估計準(zhǔn)確率Fig.5 The azimuth estimation accuracies of the OC,the IMF,the WWSBL-OGBSSL methods in real environments

        從圖5中可以看出,在實際環(huán)境下WWSBLOGBSSL算法對在格聲源和離格聲源的方位角估計準(zhǔn)確率比OC算法和IMF算法高出15%左右。這是因為WWSBL-OGBSSL算法基于BCDR對各個頻點進行加權(quán),去除了受混響影響比較嚴重的頻點的雙耳信號,有效降低了混響的影響;而且WWSBL-OGBSSL算法中能量高的頻點有著更大的權(quán)重。另外,從圖5中可以看出三種算法對人工頭正前方聲源的方位角估計性能明顯優(yōu)于人工頭兩側(cè)聲源的方位角估計性能,這是因為人工頭正前方聲源方位角的變化對雙耳信號雙耳特征的影響更顯著,因此定位性能更好。

        4 結(jié)論

        針對雙耳聲源定位中的離格問題,提出了基于加權(quán)寬帶稀疏貝葉斯學(xué)習(xí)的離格雙耳聲源定位算法(WWSBL-OGBSSL)。首先,該算法基于壓縮感知理論建立了離格稀疏雙耳信號模型,將離格雙耳聲源定位問題簡化為一個凸優(yōu)化問題,并采用雙耳相干與擴散能量比特征對各個頻點進行加權(quán)以降低噪聲和混響的影響,然后通過加權(quán)寬帶稀疏貝葉斯學(xué)習(xí)方法來估計模型參數(shù),最終實現(xiàn)離格聲源方位角估計。與現(xiàn)有的離格陣列DOA估計算法相比,離格雙耳聲源定位算法既考慮了離格問題的影響,也考慮了頭和軀干的陰影效應(yīng)的影響。仿真和實際實驗結(jié)果表明,本文算法在各種聲學(xué)環(huán)境下都有著更高的定位精度和更強的魯棒性,特別是提高了離格條件下的雙耳聲源方位角估計性能。

        猜你喜歡
        混響雙耳頻點
        板式混響在錄音鼓組中產(chǎn)生的作用
        三角洲(2024年15期)2024-12-31 00:00:00
        基于4G MR的大數(shù)據(jù)分析優(yōu)化EPSFB語音時延
        輕叩雙耳好處多
        輕叩雙耳好處多
        哥窯青釉雙耳彝爐
        紫禁城(2020年5期)2021-01-07 02:13:34
        海洋混響特性分析與建模仿真研究?
        輕叩雙耳好處多
        基于測量報告數(shù)據(jù)優(yōu)化CSFB頻點配置的方法
        用于室內(nèi)環(huán)境說話人識別的混響補償方法
        載帶壓縮11頻點創(chuàng)新方案
        伊人久久大香线蕉免费视频| 亚洲无人区乱码中文字幕能看| 亚洲色图专区在线观看| 国产欧美高清在线观看| 少妇做爰免费视频了| 亚洲av天天做在线观看| 亚洲精品无码人妻无码| 欧美一区二区午夜福利在线yw| 久久久久无码精品国| 精品奇米国产一区二区三区| 亚洲国产系列一区二区| 射精区-区区三区| 天堂影院一区二区三区四区| 澳门毛片精品一区二区三区| 91热视频在线观看| 亚洲岛国一区二区三区| 人妻精品人妻一区二区三区四区 | 国产内射999视频一区| 亚洲丁香婷婷综合久久小说| 久久久高清免费视频| 亚洲一区二区三区最新视频 | 国产精品天天在线午夜更新| 久久青草伊人精品| 精品亚亚洲成av人片在线观看| 青青草手机视频免费在线播放| 国产伦一区二区三区色一情| 国产太嫩了在线观看| 无遮挡又黄又刺激又爽的视频| 香蕉视频毛片| 蜜臀av一区二区三区精品| 中文字幕日韩有码国产| 国产在线精品一区二区三区| 好屌草这里只有精品| 欧美整片第一页| 青青草最新在线视频观看| 白白色发布的在线视频| 午夜男女很黄的视频| 亚洲精品国产第一区二区尤物| 女女同性黄网在线观看| 少妇裸淫交视频免费看| 亚洲天堂精品一区入口|