亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進(jìn)DSB方法的語(yǔ)音信號(hào)多聲源定位

        2021-01-11 09:12:34黃麗霞張雪英
        關(guān)鍵詞:混響反射系數(shù)麥克風(fēng)

        王 杰,黃麗霞,張雪英

        太原理工大學(xué) 信息與計(jì)算機(jī)學(xué)院,太原030024

        聲源定位在軍事和民用領(lǐng)域具有許多應(yīng)用,例如混合音頻信號(hào)分離、視頻會(huì)議、語(yǔ)音增強(qiáng)、聲源跟蹤、水下聲學(xué)、指導(dǎo)機(jī)器人和高級(jí)助聽器[1-4]。傳統(tǒng)的聲源定位算法分為三大類:(1)到達(dá)時(shí)間差TDOA(Time Difference of Arrival);(2)高分辨率譜估計(jì);(3)波束形成[5]。到達(dá)時(shí)間差TDOA方法,如GCC[6](Generalized Cross Correlation)算法,主要由于其計(jì)算量小的特點(diǎn)被廣泛應(yīng)用,但僅適用于單聲源信號(hào)定位,在多個(gè)聲源下定位性能較差?;诟叻直孀V估計(jì)的方法主要用于窄帶和遠(yuǎn)場(chǎng)信號(hào)處理,如MUSIC[7](Multiple Signal Classification)算法、ESPRIT[8](Estimating Signal Parameter Viarotational Invariance Techniques)算法與加權(quán)子空間擬合算法[9]等,基于高分辨譜估計(jì)的方法運(yùn)算量大,且對(duì)陣列誤差非常敏感,方位分辨信噪比門限較高,應(yīng)用到實(shí)際環(huán)境下較為困難[10]。而波束形成方法在方向估計(jì)上具有良好的穩(wěn)定性。目前針對(duì)窄帶信號(hào)的多聲源波束形成定位技術(shù)已比較成熟,如延遲求和波束形成DSB[11](Delay and Sum Beamforming)、LMS[12](Least Mean Square)和MVDR[13](Minimum Variance Distortionless Response)等算法。延遲求和波束形成(DSB)是最簡(jiǎn)單的波束形成,盡管其分辨率較低,但由于具有穩(wěn)健性高、不需要目標(biāo)信號(hào)先驗(yàn)知識(shí)、運(yùn)算量低等優(yōu)點(diǎn),依然得到廣泛運(yùn)用。然而在實(shí)際信號(hào)環(huán)境中,聲源定位面對(duì)的更多是語(yǔ)音寬帶信號(hào)。語(yǔ)音信號(hào)包含著更多的頻率分量,分析更加復(fù)雜[14]。此外在利用波束形成識(shí)別語(yǔ)音信號(hào)源時(shí),由于語(yǔ)音信號(hào)頻率高低不同,會(huì)存在著旁瓣、柵瓣[15-16]等問(wèn)題。因此針對(duì)多個(gè)寬帶語(yǔ)音信號(hào)源角度估計(jì)研究也更具挑戰(zhàn)性。國(guó)外,針對(duì)DSB方法改進(jìn)有很多研究,但在多聲源定位應(yīng)用很少,幾乎都應(yīng)用在其他領(lǐng)域,如Mozaffarzadeh等人[17]在光聲成像(PAI)應(yīng)用中引入了使用最小方差(MV)自適應(yīng)波束形成技術(shù)與延遲乘求和(DMAS)相結(jié)合的波束形成器,提高了圖像的分辨率。Klemm 等人[18]提出了用于乳腺癌檢測(cè)的改進(jìn)延遲求和波束成形(DSB)算法。該方法使用在每個(gè)焦點(diǎn)處計(jì)算的附加權(quán)重因子來(lái)改善圖像質(zhì)量。而在國(guó)內(nèi),已經(jīng)有部分改進(jìn)DSB 方法應(yīng)用在聲源定位上。宋雷鳴等人[15]基于DSB的beamforming方向圖矩陣來(lái)消除聲源定位中的柵瓣問(wèn)題,但該方法主要基于窄帶模型,無(wú)法真正推廣到實(shí)際環(huán)境中;龐金成等人[19]基于寬帶信號(hào)模型對(duì)DSB方法進(jìn)行平滑處理,對(duì)聲源DOA(Direction-of-Arrival)分辨率有一定的提高,但該算法主要在仿真環(huán)境下利用低頻寬帶信號(hào)作為信源,而利用實(shí)際環(huán)境中采集的語(yǔ)音信號(hào)作為信源其性能并不理想。針對(duì)實(shí)際復(fù)雜環(huán)境下,寬帶語(yǔ)音信號(hào)定位出現(xiàn)柵瓣以及受噪聲混響影響問(wèn)題,本文提出了一種改進(jìn)延遲求和波束形成方法。該方法利用語(yǔ)音信號(hào)頻率和麥克風(fēng)間距來(lái)確定子段內(nèi)的頻點(diǎn)選擇,不僅使得算法總運(yùn)算量大大降低,而且消除了柵瓣的干擾影響。之后用相位加權(quán)函數(shù)對(duì)數(shù)據(jù)協(xié)方差矩陣進(jìn)行處理,使得算法抗混響噪聲性能有了很大改善。同時(shí),搭建并實(shí)現(xiàn)了基于八元均勻圓形麥克風(fēng)陣列的聲源定位平臺(tái),將改進(jìn)前后的算法在仿真及實(shí)際下進(jìn)行了定位實(shí)驗(yàn)。

        1 麥克風(fēng)陣列模型

        若B為信號(hào)帶寬,f0為中心頻率,則通常認(rèn)為窄帶信號(hào)要滿足B/f0<0.01,否則是寬帶信號(hào)。室內(nèi)環(huán)境下,聲源信號(hào)為說(shuō)話人語(yǔ)音(語(yǔ)音信號(hào)頻率主要集中在300~3 400 Hz內(nèi))寬帶信號(hào),需要做寬帶波束形成?;诮?jīng)典窄帶技術(shù)設(shè)計(jì)寬帶波束形成的方法進(jìn)行圖1 的窄帶分解,之后在每個(gè)頻率上獨(dú)立設(shè)計(jì)窄帶波束形成[20]。

        圖2中,N個(gè)相同的全向陣元均勻分布在x-y平面一個(gè)半徑為R的圓周上,原點(diǎn)位于陣列圓心,信源俯角φ∈[0,π/2]是原點(diǎn)到信源的連線與z軸之間的夾角,方位角是原點(diǎn)到信源的連線在x-y平面上的投影與x軸之間的夾角。

        圖1 DFT寬帶波束形成器實(shí)現(xiàn)結(jié)構(gòu)

        圖2 空間陣元幾何位置圖

        考慮M個(gè)遠(yuǎn)場(chǎng)的語(yǔ)音信號(hào)入射到空間某陣列上,其中陣列由N個(gè)麥克風(fēng)組成,這里麥克風(fēng)數(shù)等于通道數(shù)。對(duì)于語(yǔ)音信號(hào),假設(shè)信號(hào)的帶寬為B,根據(jù)上面寬帶波束形成分析,第n個(gè)陣元的接收數(shù)據(jù)信號(hào)模型[21]:

        將接收信號(hào)數(shù)據(jù)分為L(zhǎng)段,對(duì)每個(gè)子段的觀察數(shù)據(jù)進(jìn)行J點(diǎn)的DFT,根據(jù)圖1 實(shí)現(xiàn),則在第l段式(2)可表示為:

        Xl(fj)、Sl(fj)、Vl(fj)分別為對(duì)應(yīng)子段l內(nèi)j點(diǎn)時(shí)頻率的接收數(shù)據(jù)、信號(hào)及噪聲的DFT 變換,這里A(fj)是N×M維陣列流型矩陣[22](導(dǎo)向矢量矩陣),可被表示為:

        2 延遲求和波束形成聲源測(cè)向方法

        通過(guò)將各陣元輸出進(jìn)行加權(quán)求和,在一時(shí)間內(nèi)將陣列波束“導(dǎo)向”到一個(gè)方向上,對(duì)期望信號(hào)得到最大輸出功率的導(dǎo)向位置即是到達(dá)方向角估計(jì)值[23],如圖3 所示。聲源到傳聲器陣列不同陣元的距離是存在差異的,因此各陣元接收的聲波信號(hào)是相對(duì)于參考陣元的時(shí)間延遲或提前的數(shù)據(jù)樣本。在進(jìn)行陣列信號(hào)處理時(shí),使各陣元接收的聲波信號(hào)經(jīng)過(guò)反向時(shí)間補(bǔ)償,然后再進(jìn)行疊加[24],這就是延遲求和過(guò)程。經(jīng)過(guò)延遲求和處理后,各傳聲器陣元接收的聲壓信號(hào)會(huì)同相位進(jìn)行疊加,而其接收到的噪聲和干擾會(huì)非同相位進(jìn)行疊加,由此可以提高信號(hào)的輸出信噪比。

        圖3 延遲求和算法示意圖

        根據(jù)上面分析陣列各陣元的權(quán)矢量:

        τnm是第m個(gè)源信號(hào)在第n個(gè)麥克風(fēng)相對(duì)于參考麥克風(fēng)的時(shí)間延遲。延遲τnm與方位角和俯仰角相關(guān):

        Ω=2π(n-1)/N是均勻圓陣陣元相對(duì)于陣列中心角度,c表示聲速。式(7)可以表示為:

        波束形成器輸出信號(hào)y(k)是麥克風(fēng)傳感器陣元的線性加權(quán)之和,即:

        波束形成器總的輸出功率可以表示為:

        式中,Rxx=E[x(k)xH(k)]為陣列接收數(shù)據(jù)的協(xié)方差矩陣。假設(shè)空間沒(méi)有其他干擾信號(hào),那么式(6)權(quán)矢量與目標(biāo)信源的方向矢量a(θ)的表示形式相同,即有:

        那么對(duì)于寬帶語(yǔ)音信號(hào),陣列接收信號(hào)在頻率fj處的頻域協(xié)方差矩陣[25]:

        通常情況下用來(lái)估計(jì)數(shù)據(jù)的協(xié)方差矩陣,定義為:

        Xl(fj) 是以fj為中心頻率的第l段數(shù)據(jù)的FFT。對(duì)直接應(yīng)用式(18)估計(jì)算法就可以得到該窄帶信號(hào)所對(duì)應(yīng)的方位角的估計(jì)值。對(duì)L段數(shù)據(jù)分別進(jìn)行處理,然后對(duì)這L個(gè)方位角估計(jì)采取平均,就可以得到寬帶信號(hào)的方位角估計(jì)。

        3 改進(jìn)DSB聲源測(cè)向方法

        DSB算法對(duì)于語(yǔ)音信號(hào)易發(fā)生柵瓣效應(yīng),且在中等以上的混響噪聲環(huán)境下性能較低。針對(duì)此,主要進(jìn)行兩方面的改進(jìn)。

        3.1 對(duì)運(yùn)算量最大的子段頻點(diǎn)選擇改進(jìn)

        由于聲源是語(yǔ)音信號(hào)頻率主要集中在300~3 400 Hz內(nèi)[26],先采用帶通濾波器對(duì)信號(hào)濾波,使信號(hào)頻率范圍為300~3 400 Hz。而某子段信號(hào)l中的j點(diǎn)數(shù)據(jù)所表示的頻率為:

        這里采樣率Fs=8 000 Hz,快拍數(shù)Q=256,所以選取的測(cè)試數(shù)據(jù)應(yīng)集中在11~109個(gè)頻點(diǎn)之間。為避免空間混疊[11],八元均勻圓形陣列的間距d近似可用d≤λ/2=c/2f來(lái)判定,聲源語(yǔ)音信號(hào)最高頻率為3 400 Hz,聲速c=346 m/s,可以推出λ=0.1,d=0.05 m,對(duì)應(yīng)的圓半徑[27]取為R=λ/4/sin(π/N)=0.065 m。這樣的八元麥克風(fēng)陣列孔徑小,雖然能夠避免空間混疊,但其DOA分辨率很差?;趯?shí)驗(yàn)室實(shí)驗(yàn)設(shè)備條件,在實(shí)際室內(nèi)環(huán)境下搭建的八元均勻圓形陣列的半徑R=0.25 m,反推出d=0.192 m。利用麥克風(fēng)間距可以計(jì)算截止頻率為fh=c/2d=901 Hz。此時(shí)利用式(19)計(jì)算出測(cè)試數(shù)據(jù)主要集中在第11~29個(gè)頻點(diǎn)之間。這樣選擇后,由98個(gè)頻點(diǎn)降低為18個(gè)頻點(diǎn),計(jì)算量?jī)H為原來(lái)的18.37%。顯然,頻點(diǎn)的選擇使得算法運(yùn)算量大大降低。

        如圖4是進(jìn)行頻點(diǎn)選擇后的角度估計(jì)對(duì)比,在圖4(a)中兩個(gè)峰值雖然可以分辨出來(lái),但已經(jīng)出現(xiàn)了很多柵瓣干擾,在實(shí)際復(fù)雜環(huán)境下,這種干擾更加嚴(yán)重甚至淹沒(méi)正確峰值,而進(jìn)行頻點(diǎn)選擇后可以看出改進(jìn)后明顯消除了柵瓣的影響。

        圖4 對(duì)頻點(diǎn)選擇改進(jìn)前后對(duì)比圖

        顯然,上述的方法不僅使得改進(jìn)后算法的總運(yùn)算量大大降低,而且也能更好地突出峰值防止空間混疊發(fā)生。

        3.2 對(duì)數(shù)據(jù)協(xié)方差矩陣改進(jìn)

        在實(shí)際復(fù)雜環(huán)境下,為了更好地抑制噪聲、混響的干擾,對(duì)原方法中的協(xié)方差矩陣進(jìn)行處理。在第1 章中,接收信號(hào)數(shù)據(jù)被分為L(zhǎng)段,每段共有J個(gè)頻點(diǎn)數(shù)。對(duì)式(18)進(jìn)行加權(quán)處理,于是重新定義估計(jì)譜協(xié)方差矩陣:

        4 實(shí)驗(yàn)結(jié)果與分析

        研究了本文改進(jìn)的方法在仿真和實(shí)際環(huán)境中的性能。在這兩種情況下,都使用均勻圓形陣列。

        4.1 仿真實(shí)驗(yàn)

        4.1.1 仿真環(huán)境

        使用IMAGE 模型[28]產(chǎn)生房間混響的沖擊響應(yīng),模擬一個(gè)5 m×4 m×3 m的房間,用房間墻壁、天花板(假設(shè)墻壁與天花板反射系數(shù)相同)的反射系數(shù)β(0 ≤β <1)來(lái)反映房間的混響強(qiáng)度[29]。根據(jù)混響時(shí)間T60與反射系數(shù)β的關(guān)系可知,β越大混響時(shí)間越長(zhǎng),β=0 表示理想狀態(tài),無(wú)混響。實(shí)驗(yàn)中噪聲是加入的高斯白噪聲。仿真中所用的兩段語(yǔ)音信號(hào)均取自NOIZEUS 語(yǔ)音庫(kù),采樣頻率為8 kHz,通過(guò)MATLAB將兩段語(yǔ)音融合為仿真所需要的麥克風(fēng)陣列接收混合語(yǔ)音信號(hào)。實(shí)驗(yàn)采用兩個(gè)語(yǔ)音聲源,假設(shè)兩聲源位置分別是S1(2,2,2)和S2(-2,-2,2),即兩聲源S1和S2的方位角分別是45°和225°,均勻麥克風(fēng)陣列半徑為0.25 m。房間麥克風(fēng)陣列擺放仿真平面圖如圖5。用角度估計(jì)偏差參數(shù)來(lái)評(píng)估角度定位性能[25]。估計(jì)偏差定義為:

        P表示為一次評(píng)估結(jié)果中實(shí)驗(yàn)次數(shù),采用實(shí)驗(yàn)次數(shù)P=10 為一次實(shí)驗(yàn)評(píng)估結(jié)果;θ1和θ2表示預(yù)先布置好的兩聲源方位角,表示每次估計(jì)的兩聲源方位角。

        圖5 麥克風(fēng)陣列擺放平面仿真圖

        4.1.2 仿真結(jié)果與分析

        實(shí)驗(yàn)1 本實(shí)驗(yàn)中主要驗(yàn)證改進(jìn)算法在不同麥克風(fēng)數(shù)量下的定位性能。在同一仿真環(huán)境下,分別使用4個(gè)均勻圓型麥克風(fēng)陣列(Ω=0°,90°,180°,270°)和8 個(gè)均勻圓型麥克風(fēng)陣列(Ω=0°,45°,…,315°)。

        如圖6、7 是圖8 中一次實(shí)驗(yàn)結(jié)果,圖8 詳細(xì)比較了陣元數(shù)量不同、無(wú)混響下噪聲對(duì)算法的影響,可以看出麥克風(fēng)數(shù)量N為4 時(shí),改進(jìn)算法在信噪比SNR大于15 dB后,偏差基本保持不變;N=8 時(shí),算法在SNR大于0 dB 后性能基本穩(wěn)定,SNR=-5 dB 時(shí)的偏差1.5°也要低于N=4時(shí)的2.5°,同時(shí)偏差整體均值要低于N=4時(shí)的均值。因此在中等以上噪聲下,麥克風(fēng)數(shù)量越多,算法估計(jì)性能越好。

        圖6 β=0,SNR=10 dB改進(jìn)算法方位角估計(jì)

        圖7 β=0,SNR=-5 dB改進(jìn)算法方位角估計(jì)

        圖8 β=0 改進(jìn)算法在不同信噪比下角度估計(jì)偏差

        如圖9詳細(xì)比較了在陣元數(shù)量不同、無(wú)噪聲下房間混響對(duì)算法的影響,在房間混響反射系數(shù)β≤0.4 時(shí),麥克風(fēng)數(shù)量N=4和8抗混響性能趨于穩(wěn)定,性能較好;在強(qiáng)混響反射系數(shù)β=0.6 環(huán)境下,算法在8個(gè)麥克風(fēng)角度估計(jì)偏差比4個(gè)麥克風(fēng)降低了6°;在中等以上混響(β>0.4)環(huán)境下,麥克風(fēng)數(shù)量越多,算法的抗混響性能越好。

        為進(jìn)一步分析源信號(hào)角度定位偏差與信噪比和混響反射系數(shù)β之間的關(guān)系,進(jìn)行以下實(shí)驗(yàn)。

        如圖10、11 的實(shí)驗(yàn)中加入的高斯白噪聲信噪比都是10 dB。圖10 中混響反射系數(shù)為0.3,實(shí)驗(yàn)表明在中等混響下,算法在麥克風(fēng)數(shù)量N=4 或8時(shí),都能正確地估計(jì)出方位角角度。圖11 中混響反射系數(shù)為0.6,即在強(qiáng)混響環(huán)境下,可以看出麥克風(fēng)數(shù)量N=4 時(shí),算法估計(jì)的方位角結(jié)果完全錯(cuò)誤;N=8 時(shí),由于麥克風(fēng)數(shù)量增多,即使環(huán)境混響很大,基本還是可以估計(jì)兩聲源信號(hào)的角度,但不可避免估計(jì)的結(jié)果誤差增大。

        圖9 無(wú)噪聲下改進(jìn)算法在不同β 下角度估計(jì)偏差

        圖10 SNR=10 dB,β=0.3改進(jìn)算法方位角估計(jì)

        圖11 SNR=10 dB,β=0.6改進(jìn)算法方位角估計(jì)

        如圖12、13 實(shí)驗(yàn)表明麥克風(fēng)數(shù)量N分別為4 和8,在不同混響環(huán)境中,兩個(gè)聲源的方位角估計(jì)偏差與噪聲信噪比的關(guān)系。實(shí)驗(yàn)結(jié)果表明在無(wú)混響(β=0)、一般混響(β=0.2) 和中等混響(β=0.4) 條件下,麥克風(fēng)數(shù)量N=4 和8時(shí),隨著噪聲信噪比的增加,算法定位性能越好,二者都能很好地估計(jì)出信號(hào)源角度,定位性能相差不大;在強(qiáng)混響(β=0.6)環(huán)境下,麥克風(fēng)數(shù)量為4和8時(shí)雖然算法的定位偏差皆隨著信噪比的降低而增大,但麥克風(fēng)數(shù)量為8時(shí)顯然比數(shù)量為4時(shí)有著更低的偏差。因此,N=8 時(shí)算法也有著更好的定位性能。從圖12實(shí)驗(yàn)結(jié)果可知,在SNR=-5 dB、0 dB 時(shí),麥克風(fēng)數(shù)量為4 個(gè)時(shí)偏差太大已經(jīng)無(wú)法有效估計(jì)出信號(hào)源方位角。

        圖12 N=4時(shí)改進(jìn)算法在不同β、SNR下方位角估計(jì)偏差

        圖13 N=8時(shí)改進(jìn)算法在不同β、SNR 下方位角估計(jì)偏差

        綜合以上實(shí)驗(yàn)結(jié)果分析可知,在同等環(huán)境下,麥克風(fēng)的數(shù)量N=8 時(shí)要比N=4 定位性能好??梢酝浦溈孙L(fēng)數(shù)量越多算法定位性能越好,然而隨著麥克風(fēng)數(shù)量增加的同時(shí),也增加了實(shí)際成本以及運(yùn)算量復(fù)雜度。

        實(shí)驗(yàn)2 為了對(duì)所提算法中“頻點(diǎn)選擇改進(jìn)”和“協(xié)方差矩陣改進(jìn)”的有效性進(jìn)行驗(yàn)證,在同一仿真環(huán)境,將算法應(yīng)用在8 個(gè)均勻圓型麥克風(fēng)陣列(Ω=0°,45°,…,315°)下進(jìn)行實(shí)驗(yàn)。

        如圖14是DSB僅進(jìn)行頻點(diǎn)選擇(為便于描述,將此部分改進(jìn)算法標(biāo)記為DSB_F),對(duì)比未改進(jìn)的DSB 算法,實(shí)驗(yàn)結(jié)果顯示當(dāng)反射系數(shù)β為0.2(混響較低)時(shí),DSB_F 算法與DSB 算法相比,方位角角度整體估計(jì)平均偏差降低了13.6%;反射系數(shù)為0.4(混響增強(qiáng))時(shí),DSB_F 算法與DSB 算法相比,角度估計(jì)平均偏差降低了18%;反射系數(shù)為0.6(強(qiáng)混響)時(shí),DSB_F算法與DSB算法相比,角度估計(jì)平均偏差降低了26.8%。

        如圖15是DSB僅進(jìn)行協(xié)方差加權(quán)(為便于描述,將此部分改進(jìn)算法標(biāo)記為DSB_Q),對(duì)比未改進(jìn)的DSB算法,實(shí)驗(yàn)結(jié)果顯示當(dāng)反射系數(shù)β為0.2 時(shí),DSB_Q 算法與DSB算法相比,方位角角度整體估計(jì)平均偏差降低了14.8%;反射系數(shù)為0.4時(shí),DSB_Q算法與DSB算法相比,角度估計(jì)平均偏差降低了18%;反射系數(shù)為0.6時(shí),DSB_Q算法與DSB算法相比,角度估計(jì)平均偏差降低了21%。

        圖14 同環(huán)境DSB算法頻點(diǎn)選擇前后角度偏差對(duì)比

        圖15 同環(huán)境DSB算法協(xié)方差加權(quán)前后角度偏差對(duì)比

        圖16 DSB、平滑DSB及DSB改進(jìn)算法角度偏差對(duì)比

        圖14 和15 分別對(duì)上文中第四部分的改進(jìn)進(jìn)行驗(yàn)證。綜合上述實(shí)驗(yàn)分析結(jié)果可以看出在不同噪聲混響環(huán)境下,與DSB 算法相比,DSB_F 和DSB_Q 算法的定位精度都有一定程度上的提高。

        如圖16 的實(shí)驗(yàn)?zāi)康?,是為直觀顯示改進(jìn)DSB 算法與龐金成等[19]提出的平滑DSB算法和原始DSB算法實(shí)驗(yàn)定位性能。可以看出在不同混響條件下,隨著噪聲信噪比的增加,3種算法的定位偏差都有所降低。實(shí)驗(yàn)結(jié)果表明,平滑DSB 算法和改進(jìn)后DSB 算法與原始DSB算法相比,反射系數(shù)為0.2時(shí),方位角角度整體估計(jì)平均偏差分別降低了13.6%和27.3%;反射系數(shù)為0.4 時(shí),角度估計(jì)平均偏差分別降低了17.2%和21.4%;反射系數(shù)為0.6 時(shí),角度估計(jì)平均偏差分別降低了20.8%和36%。綜合上述分析,相對(duì)于原始DSB 及平滑DSB 算法,本文改進(jìn)后的DSB算法有著更好定位性能。

        4.2 實(shí)際室內(nèi)環(huán)境實(shí)驗(yàn)

        4.2.1 實(shí)驗(yàn)環(huán)境及平臺(tái)搭建

        為了評(píng)估改進(jìn)DSB 算法在實(shí)際室內(nèi)環(huán)境中的性能,在一個(gè)小型會(huì)議室中進(jìn)行實(shí)驗(yàn)分析,房間長(zhǎng)寬高為8 m×7 m×3 m,實(shí)驗(yàn)室門窗皆關(guān)閉,實(shí)驗(yàn)過(guò)程中存在一定的混響和噪聲,包括墻壁桌椅反射以及電腦風(fēng)扇、鼠標(biāo)點(diǎn)擊等噪聲。采用八元均勻圓形麥克風(fēng)陣列(Ω=0°,45°,…,315°),以麥克風(fēng)陣列中心為參考原點(diǎn),每個(gè)麥克風(fēng)距離陣列中心的半徑為25 cm,麥克風(fēng)陣列距離地面71 cm,采樣頻率為8 kHz。利用北京聲科測(cè)聲學(xué)技術(shù)有限公司(SKC)的多通道USB數(shù)據(jù)采集卡Q801,8個(gè)麥克風(fēng)MP40,1個(gè)麥克風(fēng)陣列支架,搭建的實(shí)際室內(nèi)環(huán)境下的實(shí)驗(yàn)平臺(tái)如圖17所示。

        圖17 搭建的八元均勻圓形麥克風(fēng)陣列實(shí)驗(yàn)平臺(tái)

        4.2.2 實(shí)驗(yàn)結(jié)果分析

        本實(shí)驗(yàn)在多個(gè)不同的聲源位置采集兩聲源(女音)說(shuō)話語(yǔ)音(我到北京去)。實(shí)驗(yàn)選取表1 中兩聲源的多個(gè)位置進(jìn)行測(cè)向。如圖18 是第5 組實(shí)驗(yàn)時(shí)的方位角度估計(jì)結(jié)果??梢钥闯鲈糄SB算法估計(jì)的方位角明顯被干擾,出現(xiàn)錯(cuò)誤峰值;平滑DSB算法總體曲線上可看出在兩聲源方位角的位置出現(xiàn)波峰值,然而由于該算法不能很好處理實(shí)際環(huán)境下寬帶語(yǔ)音信號(hào),不能真正正確估計(jì)角度值;而改進(jìn)后的DSB 算法對(duì)柵瓣進(jìn)行了良好的抑制,基本能夠正確識(shí)別方位角。

        圖18 實(shí)際室內(nèi)環(huán)境下方位角估計(jì)結(jié)果

        由表1 中實(shí)驗(yàn)結(jié)果可知,在8 個(gè)麥克風(fēng)下改進(jìn)前算法由于柵瓣的存在,干擾了識(shí)別結(jié)果,出現(xiàn)了錯(cuò)誤的估計(jì)角度;而改進(jìn)算法較好地消除了柵瓣的影響,正確地識(shí)別出聲源方向。與前面仿真實(shí)驗(yàn)相比,實(shí)際室內(nèi)環(huán)境實(shí)驗(yàn)過(guò)程中存在更多的影響實(shí)驗(yàn)精度的因素,不僅包括書櫥、桌椅等障礙物,還有實(shí)驗(yàn)人員走動(dòng)、四周墻壁天花板反射以及采集卡和麥克風(fēng)、聲源坐標(biāo)位置精度誤差等,這些很大程度上造成實(shí)際實(shí)驗(yàn)結(jié)果相較于仿真實(shí)驗(yàn),定位精度有不同程度的降低。在8次的實(shí)際環(huán)境實(shí)驗(yàn)中,假設(shè)改進(jìn)前算法實(shí)驗(yàn)中不考慮出現(xiàn)明顯錯(cuò)誤的第1、5 和8 組,對(duì)比實(shí)驗(yàn)結(jié)果分析可知改進(jìn)算法偏差角度最高9°、最低為1.35°,要低于未改進(jìn)算法的12.1°和3°。改進(jìn)算法相比較未改進(jìn)算法不僅有著更穩(wěn)定的定位性能,而且估計(jì)精度也有了較大改善。

        表1 實(shí)際實(shí)驗(yàn)語(yǔ)音信號(hào)聲源不同測(cè)試位置方位角估計(jì)結(jié)果

        5 結(jié)束語(yǔ)

        本文主要研究了基于延遲求和波束形成的寬帶語(yǔ)音DOA 估計(jì)問(wèn)題。首先對(duì)子段內(nèi)的頻點(diǎn)選擇進(jìn)行篩選,然后通過(guò)相位變換加權(quán)協(xié)方差矩陣計(jì)算輸出功率估計(jì)方位角度。同時(shí),設(shè)計(jì)并實(shí)現(xiàn)了基于八元均勻麥克風(fēng)陣列的定位平臺(tái),將改進(jìn)前后的DSB 算法以及平滑DSB 算法在仿真以及實(shí)際環(huán)境中進(jìn)行了實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,相比于傳統(tǒng)DSB算法以及平滑DSB算法,改進(jìn)后DSB算法在噪聲和混響環(huán)境下明顯地消除了干擾峰值并降低了計(jì)算量,在仿真和實(shí)際實(shí)驗(yàn)中,都有較好的魯棒性。在今后的研究工作中,應(yīng)當(dāng)考慮兩聲源間距對(duì)算法定位性能的影響。

        猜你喜歡
        混響反射系數(shù)麥克風(fēng)
        板式混響在錄音鼓組中產(chǎn)生的作用
        三角洲(2024年15期)2024-12-31 00:00:00
        多道隨機(jī)稀疏反射系數(shù)反演
        石油物探(2020年6期)2020-11-25 02:38:46
        Binaural Rendering based on Linear Differential Microphone Array and Ambisonic Reproduction
        基于數(shù)字麥克風(fēng)的WIFI語(yǔ)音發(fā)射機(jī)
        海洋混響特性分析與建模仿真研究?
        麥克風(fēng)的藝術(shù)
        球面波PP反射系數(shù)的頻變特征研究
        用于室內(nèi)環(huán)境說(shuō)話人識(shí)別的混響補(bǔ)償方法
        麥克風(fēng)
        沙質(zhì)沉積物反射系數(shù)的寬帶測(cè)量方法
        日本超骚少妇熟妇视频| 亚洲成人小说| 精品人妻中文av一区二区三区| 日本一区不卡高清在线观看 | 99久久婷婷国产综合精品青草免费| 精品国产18久久久久久| 无码av免费精品一区二区三区| 日本一区二区三区激视频| 国模gogo无码人体啪啪| 国产真实夫妇交换视频| 中文字幕一区二区三区四区在线 | 久久天天躁夜夜躁狠狠躁2022 | 亚洲av区,一区二区三区色婷婷| 狠狠色综合7777久夜色撩人ⅰ| 欧美末成年videos在线观看| 亚洲双色视频在线观看| 亚洲国产一区二区三区精品| 日韩乱码人妻无码中文字幕久久| 正在播放一区| 女同av免费在线播放| 亚洲av午夜一区二区三| 亚洲av无码av制服另类专区| 亚洲国产精品自产拍久久蜜AV| 亚洲中文字幕高清在线视频一区| 一区二区和激情视频| 欧美与黑人午夜性猛交久久久| 国产精品乱子伦一区二区三区| 成人一区二区三区激情视频| 国产伦精品免编号公布| 欧美日韩精品乱国产538| 亚洲影院在线观看av| 狠狠躁夜夜躁人人爽超碰97香蕉 | 自拍欧美日韩| 国产三级三级精品久久| 中国娇小与黑人巨大交| 久久久久亚洲av无码专区网站| 四虎无码精品a∨在线观看| 日本a级免费大片网站| 97精品一区二区视频在线观看| 亚洲乱码一区二区三区成人小说| 亚洲中文字幕第一页免费|