亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        麥克風陣列下互相關函數分類的聲源定位

        2020-02-18 15:19:18張歲歲黃麗霞張雪英
        計算機工程與應用 2020年4期
        關鍵詞:實驗

        張歲歲,黃麗霞,王 杰,張雪英

        太原理工大學 信息與計算機學院,太原030024

        1 引言

        聲源定位技術是一種利用麥克風陣列接收并處理聲場信號以確定聲源位置的技術,其在基于麥克風陣列的應用中發(fā)揮著越來越重要的作用,如視頻會議[1]、語音增強、智能家居設計[2]、語音識別、智能機器人[3]、智能視頻監(jiān)控系統(tǒng)[4]等。

        目前在基于麥克風陣列的聲源定位算法方面已經有了比較成熟的理論和方法。傳統(tǒng)的聲源定位算法大致可以分為兩大類[5]:單步法和雙步法。最大似然算法(Maximum Likelihood,ML)是單步法中最主要的算法,此類算法中最熟悉的即可控相應功率相位變換(Steered Response Power-Phase Transformation,SRP-PHAT)算法;另一種單步算法即高分辨率譜估計算法。雙步法中,第一種涉及到了到達時間差(Time Difference of Arrival,TDOA)估計;另一種是基于自適應特征值分解的子空間法和廣義特征值分解。雙步法中的基于時延估計的算法因其計算量小,便于實時處理,在實際的定位系統(tǒng)中應用較多。然而室內實際環(huán)境中存在各種干擾和影響等,會對系統(tǒng)的定位存在很強的混響作用。傳統(tǒng)的聲源定位方法在高混響的惡劣環(huán)境下,定位精度下降。

        近年來,機器學習和模式識別技術已經被用來解決聲源定位問題。Strobel等人[6]提出一種基于時延估計分類的聲源定位算法,詳細研究了ML分類和基于直方圖的分類方法,在惡劣的聲學條件下,與傳統(tǒng)算法和ML分類算法相比較,基于直方圖分類的方法定位準確率提高60%以上。Zhang等人[7]提出了一種基于雙麥克風的多聲源定位技術,該技術利用語音特性和聚類及線性擬合技術。Sun等人[8]在混響環(huán)境中利用圓形麥克風陣列進行聲源數目估計和定位,通過在選定的TF(Time-Frequency)點上進行單聲源定位來解決這一問題,用無限個高斯混合模型得到到達方向(Direction of Arrival,DOA)估計,采用貝葉斯方法估計聲源和DOA的數目。該算法最大的優(yōu)勢是對聲源的個數沒有限制。Lee等人[9]提出了一種新的k均值聚類算法,即競爭k均值聚類算法。將其性能與自適應k-means++算法進行了比較,驗證了算法的有效性。最后將其應用于多聲源定位中,取得了滿意的效果。Salvati等人[10]提出了一種在混響環(huán)境中使用加權最小方差無失真響應(Weighted Minimum Variance Distortionless Response,WMVDR)的近場聲源定位算法?;跈C器學習計算WMVDR的可控響應功率,采用支持向量機(Support Vector Machine,SVM)分類器對融合分量進行選擇。Sun等人[11]提出了一種新的加權決策方法(Weighted Decision Making Method,WDMM),通過重新訪問相鄰子空間的概率,有效地提高了基于似然分類算法的定位精度。

        本文主要研究了基于相位變換加權函數分類的聲源定位問題,引入了Fisher加權樸素貝葉斯分類器。通過PHAT互相關函數得到特征向量,然后利用Fisher加權樸素貝葉斯分類器估計聲源位置。設計并實現了僅基于兩個麥克風的聲源定位系統(tǒng),并將改進的定位算法在實際環(huán)境中進行了聲源定位實驗。

        2 加權廣義互相關函數特征提取

        2.1 信號模型

        在實際環(huán)境中,室內麥克風陣列接收到的信號不僅包括聲源發(fā)出的信號,而且還包含房間背景噪聲和房間混響。對于由M個陣元組成的麥克風陣列,第m個麥克風接收到的信號可由下式表示:

        其中,s(n)表示聲源;hm(n)表示聲源到第m個麥克風的房間脈沖響應,包含多徑傳播和衰減信息;wm(n)表示房間背景噪聲;?表示卷積算子。本文重點研究混響對定位算法的影響,即假設wm(n)=0。

        其中,Prl(Y' )由均值向量Url和協(xié)方差矩陣Qrl決定。

        2.2 加權廣義互相關函數

        兩個麥克風接收到的信號可以分別表示為x1(t)、x2(t),兩個信號的廣義互相關函數(Generalized Cross-Correlation,GCC)等于兩信號互功率譜的傅里葉變換,如下式表示:

        其中,Gx1x2(τ)=x1(ω)x?2(ω)表示被測信號x1(t)、x2(t)的互功率譜密度函數;x1(ω)、x2(ω)分別表示麥克風m1m2接收到信號x1(t)、x2(t)的傅里葉變換;?表示復共軛。

        但在高混響環(huán)境下,容易引起互相關函數峰值變寬,出現假峰值。為了銳化峰值,在信號中加入不同的加權函數,首先抑制混響干擾,提高互相關函數的抗混響能力。因此,式(3)可以描述為:

        這里,ψ12(ω)表示不同的加權函數,實際應用中,選擇最合適的加權函數對GCC函數的性能非常重要[13]。很多文獻中提出了各種加權函數,本文主要涉及PHAT加權函數:

        將式(5)帶入式(4),兩信號的廣義互相關函數如下:

        2.3 特征提取

        基于互相關函數分類的聲源定位算法分為兩個階段:訓練階段和定位階段。

        算法訓練階段如圖1所示。樸素貝葉斯分類器的訓練階段就是利用特征向量進行訓練,得到相應特征的均值uij和方差σ2ij,由廣義互相關函數Rx1x2(τ)形成特征向量。

        圖1 算法訓練階段

        訓練階段位置rl,l=1,2,…,L處的特征向量為:

        這里,D表示兩個麥克風之間的距離;c表示聲速;fs表示采樣頻率;δ表示因子,在后面的實驗中設為1.67;round(?)表示取整。

        3 基于互相關函數分類的聲源定位

        3.1 樸素貝葉斯理論

        樸素貝葉斯分類器[14]在估計類條件概率密度時假設屬性之間條件獨立,即特征獨立性假設,高斯分布通常被用來表示連續(xù)屬性的類條件概率分布。高斯分布的兩個參數分別是均值uij和方差,對于每個類yj,屬性Xi的類條件概率由下式表示:

        參數uij可以用類yj的所有訓練記錄關于Xi的樣本均值來估計。同理,可以用這些訓練記錄的樣本方差來估計。

        3.2 基于Fisher加權的樸素貝葉斯分類器

        NBC模型認為[15],所有特征對于最終的分類結果具有同等重要的意義(即權重為1)。但是單個特征和類別之間存在不同程度的相關性,樸素貝葉斯算法直接忽略了這種相關性,可能會增加分類的誤判。本文將特征加權算法與樸素貝葉斯分類器相結合,根據其對分類的重要性給出不同的權重。屬性權重越大,屬性對分類的影響越大。將NBC擴展到加權NBC(Weighted Naive Bayes Classifier,WNBC),以提高分類器的性能。本文采用Fisher判別準則函數,確定各個特征的分類權重。

        在位置rl,l=1,2,…,L處分別使用M幀數據估計單個特征的均值、方差和權重,即:

        類間離差值和類內離差值分別為:

        則特征yi,i=1,2,…,2τm+1的Fisher準則判別函數如下:

        在Fisher判別理論中,類間離差值被用來描述不同類之間的差距。類內離差值用來描述同一類樣本之間的差距。

        當特征的權重高于平均值時,權重應大于1,以增加其對分類的影響;當特征的權重低于平均值時,權重應小于1,以減少其對分類的影響。

        最終確定權重的方法定義如下:

        3.3 基于互相關函數分類的聲源定位

        基于互相關函數分類的聲源定位算法的測試階段如圖2所示。

        圖2 算法測試階段

        由以上內容可知,假設對于每個特征yli,i=1,2,…,2τm+1是相互獨立的,那么測試階段位置rl,l=1,2,…,K的特征向量Y(rl)的概率密度函數由下式給出:

        因此,采用Fisher加權的樸素貝葉斯分類器的判別函數為:

        假設在測試階段使用多幀特征向量即特征向量集合Y'(rl)={Yt(rl), t=1,2,…,N},則集合Y'的概率密度函數為:這里表示第l個位置第t幀測試數據的第i個特征。

        最終聲源位于使得概率密度函數Prl(Y' )或者Prl(Y)取得最大值的位置,即:

        4 實驗結果與分析

        4.1 仿真實驗

        4.1.1 實驗環(huán)境和條件

        實驗用鏡像法(Image)生成房間脈沖響應,來模擬一個普通的實驗室環(huán)境,房間尺寸為6 m×4 m×3 m,兩麥克風的坐標分別是M1(3.85,2.5,1.2)、M2(4.15,2.5,1.2),采樣率16 kHz,聲源距離兩個麥克風中點的距離距離為2 m。假設房間墻壁的反射系數β相同,根據混響時間T60與反射系數β的關系可得,反射系數越大,混響時間越大。訓練和定位階段使用雙門限端點檢測算法對信號進行端點檢測,并對信號進行分幀,幀長512,幀移256,每幀信號加矩形窗。在實驗過程中,聲源的位置有17個,即聲源與兩麥克風中點的夾角分別為(10°,20°,… ,170°)。仿真房間平面圖如圖3所示。

        4.1.2 仿真結果與分析

        為了便于描述,將使用樸素貝葉斯分類器的分類算法標記為NBC_P,將使用基于Fisher加權的樸素貝葉斯分類器的分類算法標記為FWNBC_P。

        (1)房間混響的影響

        在本實驗中,主要驗證了算法在不同混響環(huán)境下的定位性能。測試幀數分別為4幀、5幀和6幀。

        圖3 仿真房間平面圖

        圖4實驗結果表明,在不同的混響β=0.2,0.4,0.6,0.8環(huán)境下,與NBC_P算法相比,FWNBC_P算法在不同測試數據幀下定位精度都有一定程度的提高。當使用較少的測試數據幀(4幀)時,兩種算法的精度隨著混響的增加而顯著降低,與NBC_P算法相比,FWNBC_P算法的定位準確率平均提高11.71%;當使用較多的測試數據幀(5幀)時,與NBC_P算法相比,FWNBC_P算法的定位準確率平均提高7.73%。當使用更多的測試幀(6幀)時,FWNBC_P算法表現出更好的性能,定位準確率平均提高16.16%。

        通過以上分析,可以看出在不同混響條件下,與NBC_P算法相比較,FWNBC_P算法的定位精度都有一定程度的提高。

        (2)測試數據幀的影響

        在本實驗中,主要驗證了算法在不同測試數據幀數下的定位性能,反射系數分別為0.4、0.6、0.8。

        圖4 不同混響環(huán)境下不同幀測試數據的兩種算法的定位精度

        圖5 不同測試數據幀時兩種算法的定位準確率

        圖5實驗結果表明,在不同的測試數據幀下,與NBC_P算法相比,FWNBC_P算法在不同測試數據幀下定位精度都有一定程度的提高。當混響較低(β=0.4)時,兩種算法的準確率隨著測試數據幀數的增加而顯著提高,與NBC_P算法相比,FWNBC_P算法的定位準確率平均提高10.54%;當混響增強(β=0.6)時,與NBC_P算法相比,FWNBC_P算法的定位準確率平均提高11.32%;當處于強混響環(huán)境(β=0.8)時,FWNBC_P算法的定位準確率平均提高4.88%。

        通過以上分析,可以看出在不同混響條件下,隨著測試數據幀數的增加,兩種算法的定位準確率都有所提高。與NBC_P算法相比較,FWNBC_P算法有更好的魯棒性。

        4.2 真實實驗

        4.2.1 實驗環(huán)境

        為了評估基于互相關函數分類的定位算法在真實環(huán)境中的可行性,在一個小型會議室中進行了初步的真實數據的實驗,房間大小是8 m×7 m×3 m。實驗過程中存在一定的噪聲和混響,噪聲包含電腦運轉的聲音以及房間外人員走動的腳步聲,房間內有桌椅、書櫥以及墻壁等障礙物,實驗過程中盡量保證聲源與麥克風之間不存在障礙物。使用兩元麥克風陣列,兩麥克風的間距為25 cm,采樣頻率為8 kHz。搭建的實際環(huán)境下的定位圖如圖6所示。整個系統(tǒng)分為軟件和硬件兩部分,如圖7所示。

        圖6 實際環(huán)境下的聲源定位系統(tǒng)

        圖7 聲源定位系統(tǒng)的組成

        4.2.2 系統(tǒng)組成

        (1)麥克風陣列。陣列采用兩元線陣麥克風陣列,麥克風使用了MP40傳聲器。MP40傳聲器是1/4英寸預極化自由場測量傳聲器,無需極化電壓,是一款與前置放大器不可分離的產品,具有靈敏度高、穩(wěn)定性好、可靠性高等特點。

        (2)采集卡。本文采用SKC公司的USB數據采集卡Q801,這是一款基于USB總線的高性能多功能數據采集卡,具有8路單端16位高速同步模擬信號采集功能。

        4.2.3 工作過程

        本聲源定位系統(tǒng)的實現過程如下:首先將麥克風按照一定的結構組成麥克風陣列(一字線陣),進行系統(tǒng)的初始化;然后對各個麥克風進行AD采樣;如果麥克風陣列接收到音頻信號,則將采樣后的音頻信號數據傳給PC機;利用PC機對音頻信號進行相關去噪和預處理,最后利用本文算法進行互相關函數的鑒別,從而確定最終聲源位置。

        4.3 實驗結果分析

        本實驗采用不同的聲源位置,聲源距離兩麥克風中點的距離分別為1.0 m、1.5 m、2.0 m,測試數據幀分別使用5幀、6幀,麥克風坐標M1(-0.125,0,0),M2(0.125,0,0),真實實驗過程中設計了18組實驗來估計聲源位置。表1給出了使用5幀測試數據且聲源距離麥克風陣列中心距離分別為1.0 m、1.5 m、2.0 m時的不同測試位置的定位準確率。

        表1 真實實驗不同測試位置定位準確率%

        與仿真實驗相比,真實實驗過程中存在更多的影響實驗精度的因素,包括桌椅、書櫥、實驗人員、四周墻壁等障礙物以及房間外的不同噪聲、采集卡和麥克風陣列的精度等,造成真實實驗結果與仿真實驗相比較,定位精度有一定程度的降低。

        圖8實驗結果顯示,FWNBC_P算法在實際環(huán)境下搭建的定位系統(tǒng)中定位準確率優(yōu)于NBC_P算法。聲源距離為1.0 m時,FWNBC_P算法的定位準確率與NBC_P算法相比,平均提高1.62%;聲源距離1.5 m時,FWNBC_P算法的準確率與NBC_P算法相比,平均提高0.46%;聲源距離為2.0 m時,與NBC_P算法相比,FWNBC_P算法的準確率平均提高3.24%。

        5 結束語

        圖8 實際環(huán)境下系統(tǒng)的定位準確率

        本文主要研究了基于相位變換加權的互相關函數分類的聲源定位問題,引入了Fisher加權樸素貝葉斯分類器。通過PHAT互相關函數得到特征向量,然后利用Fisher加權樸素貝葉斯分類器估計聲源位置。同時,設計并實現了僅基于兩個麥克風的聲源定位系統(tǒng),并將改進的定位算法在實際環(huán)境中進行了聲源定位實驗。實驗結果顯示,與參考算法NBC_P相比較,改進算法在仿真實驗和真實實驗中,都有較好的魯棒性。在今后的研究工作中,應當考慮噪聲對算法準確率的影響,以及考慮將該算法應用于多聲源定位研究中。

        猜你喜歡
        實驗
        我做了一項小實驗
        記住“三個字”,寫好小實驗
        我做了一項小實驗
        我做了一項小實驗
        記一次有趣的實驗
        有趣的實驗
        小主人報(2022年4期)2022-08-09 08:52:06
        微型實驗里看“燃燒”
        做個怪怪長實驗
        NO與NO2相互轉化實驗的改進
        實踐十號上的19項實驗
        太空探索(2016年5期)2016-07-12 15:17:55
        国产精品美女久久久久 | 日韩精品一区二区三区视频| 国产情侣自拍在线视频| 亚洲日韩一区精品射精| 欧美日韩电影一区| 国产亚洲一区二区三区三州| 人妻一区二区三区av| 一区二区三区国产| 手机看片1024精品国产| 91在线观看国产自拍| 岛国熟女精品一区二区三区| 国产探花在线精品一区二区| 99re免费在线视频| 一本久久伊人热热精品中文| 不卡一区二区黄色av| 狠狠噜天天噜日日噜视频麻豆| 国模精品二区| 国产成人亚洲综合二区| 在线观看人成视频免费| 欧美日本国产va高清cabal| 久久精品国产亚洲AV香蕉吃奶| 日日高潮夜夜爽高清视频| 亚洲欧美牲交| 99精品久久这里只有精品| 黄色三级国产在线观看| 精品欧美一区二区三区久久久| 熟妇的荡欲色综合亚洲| 亚洲中文久久久久无码| 今井夏帆在线中文字幕| 国产两女互慰高潮视频在线观看| 中文字幕一区二区三区久久网站| 日韩精品视频在线一二三| 亚洲蜜臀av一区二区三区| 国产精品久久久久久亚洲av | 人妻系列无码专区久久五月天| 91亚洲欧洲日产国码精品| 日本不卡视频一区二区| 边喂奶边中出的人妻| 中文 国产 无码免费| 日本午夜理论一区二区在线观看| 国产在线精品一区二区中文|