覃虹菱,王玫,2,宋浠瑜,周陬,羅麗燕
基于聲學(xué)脈沖響應(yīng)的室內(nèi)建圖算法研究
覃虹菱1,王玫1,2,宋浠瑜1,周陬1,羅麗燕1
(1. 桂林電子科技大學(xué)認知無線電與信息處理省部共建教育部重點實驗室,廣西桂林 541004;2.桂林理工大學(xué)信息科學(xué)與工程學(xué)院,廣西桂林 541004)
由于室內(nèi)環(huán)境下噪聲及混響干擾造成聲學(xué)脈沖響應(yīng)(Acoustic Impulse Response, AIR)的波達時間(Time of Arrival, TOA)模糊,導(dǎo)致現(xiàn)有室內(nèi)空間幾何建圖技術(shù)存在計算復(fù)雜等缺點,提出一種基于AIR可信度判斷與霍夫變換結(jié)合的定位和建圖一步完成的方法。該方法基于到達時間差(Time Difference of Arrival, TDOA)迭代估計聲源位置并計算準確的TOA,隨后基于聲收發(fā)設(shè)備與一階反射TOA關(guān)于反射面的橢圓約束關(guān)系,結(jié)合可信度判斷與霍夫變換,篩選可信低階TOA以實現(xiàn)室內(nèi)反射面的二維位置估計。蒙特卡洛仿真結(jié)果表明,在混響時間60為0.134 7 s、AIR誤差標(biāo)準差為22.7×10-3ms、大小為10 m×8 m×4 m復(fù)雜室內(nèi)環(huán)境下,墻面定位平均距離誤差為10.1 cm,平均角度誤差為2.795 8°。在大小為5.26 m×3.5 m×3.35 m的真實房間中,該方法可以實現(xiàn)聲源與墻體位置的同時定位,完成規(guī)則盒型房間的二維地圖重構(gòu),且墻面定位平均距離誤差為2.6 cm,平均角度誤差為2.17°。
聲學(xué)脈沖響應(yīng);室內(nèi)定位與建圖;橢圓約束;霍夫變換
隨著基于用戶位置信息的相關(guān)技術(shù)的應(yīng)用和發(fā)展,位置服務(wù)已經(jīng)成為人們?nèi)粘9ぷ鳌⑸钏仨毜囊豁椈痉?wù)需求,常用于室內(nèi)定位、機器人導(dǎo)航等[1-2]。這種技術(shù)應(yīng)用時需要一個環(huán)境地圖。傳統(tǒng)的室內(nèi)建圖方法,如基于視覺圖像[3]、測距傳感[4]的移動機器人即時定位與地圖構(gòu)建(Simultaneous Localization and Mapping, SLAM)等都因為其特定的條件依賴,未能得到推廣。在室內(nèi)環(huán)境中,聲信號的傳播在一定程度上反映了室內(nèi)布置和結(jié)構(gòu)信息,且相比電磁波、光波擁有更低的波速,更適用于室內(nèi)地圖的創(chuàng)建[5]。
房間結(jié)構(gòu)的混響特性會使得聲學(xué)脈沖響應(yīng)(Acoustic Impulse Response, AIR)中波達時間(Time of Arrival, TOA)存在高階反射早于低階反射的情況,造成TOA模糊問題。文獻[6]、[7]采用近墻單發(fā)單收方式避免TOA產(chǎn)生模糊,但是完成多個反射面的估計需要單聲源移動測量多次,此位移過程中的累積位姿誤差降低了其定位與重構(gòu)性能。相對于單麥克風(fēng),麥克風(fēng)陣列在時域和頻域的基礎(chǔ)上增加了空間域,對聲音信息的處理能力增強[8]。文獻[9]通過歐式距離陣(Euclidean Distance Matrix, EDM)將AIR中的一階反射TOA分配到各個墻體來解決TOA模糊,再基于聲源、虛聲源與反射面的幾何位置關(guān)系完成反射面估計,測量步驟簡單但后續(xù)計算繁瑣?;谑瞻l(fā)設(shè)備與反射面之間的橢圓約束位置幾何關(guān)系也可以直接定位反射面位置。文獻[10]、[11]分別通過到達方向(Direction of Arrival, DOA)和近墻先驗條件的方式解決TOA模糊問題。但前者僅適用于單反射面估計,后者雖運用霍夫變換進行降噪處理,但其采用的非迭代到達時間差(Time Difference of Arrival, TDOA)聲源定位算法與集中型麥克風(fēng)陣型的組合方式在低信噪比環(huán)境下定位精度較低,并傳遞到后續(xù)的反射面估計。文獻[12]以任意排布麥克風(fēng)陣列方式布置大量錨節(jié)點,結(jié)合地圖映射的尺度變換(Multi-dimensional Scaling with Map Matching, MDS-MAP)、EDM和霍夫變換提出一種多路徑輔助協(xié)同定位和映射(Multipath-aided Cooperative Localization and Mapping, MCLAM)算法來處理每組節(jié)點的數(shù)據(jù),實現(xiàn)復(fù)雜且計算量大。
本文充分考慮了麥克風(fēng)陣元分布對聲源位置估計精度的影響,針對現(xiàn)有空間幾何重構(gòu)方案中聲源定位方法的缺點,利用基于TDOA最小二乘思想的列文伯格-馬夸爾特算法(Levenberg-Marquardt Algorithm, LMA)[13]對聲源位置進行估計,并由此得到準確的TOA信息;再利用一階反射TOA建立聲收發(fā)設(shè)備與反射墻面之間的橢圓約束條件,通過公切線算法(COmmon Tangent Algorithm, COTA)[14]對反射面進行初步估計;最后加入不同聲源位置的AIR,并利用可信度判斷找到混響環(huán)境中的可信低階多徑TOA,通過霍夫變換降低噪聲影響,獲得更為準確的墻面位置估計的修正結(jié)果。
根據(jù)投影幾何理論,圖1描述的橢圓幾何約束關(guān)系可以表示為
圖1 聲收發(fā)設(shè)備及反射面關(guān)于一階反射的橢圓幾何關(guān)系
即時定位與地圖構(gòu)建系統(tǒng)框圖如圖2所示。本文工作涉及到圖2中虛框所示的兩個部分,其中,表示不同聲源位置,表示房間中的不同反射面。
圖2 即時定位與地圖構(gòu)建系統(tǒng)框圖
由于設(shè)備之間存在異步問題,利用TDOA迭代定位算法可得到聲源位置,再求出AIR中一系列反映各階反射的準確TOA。對于基于TDOA的聲源定位,聲源在陣列內(nèi)部時,定位精度比遠離陣列時的定位精度高[15]。采取分布式麥克風(fēng)陣列的陣型,能夠增大麥克風(fēng)陣列的相對基線長度,提高聲源定位的精度,同時也能夠使反射點的分布更加分散,對反射面的位置估計不易產(chǎn)生角度誤差。
聲源位置的迭代更新公式為
多接收情況下,單個源與接收點之間會形成一組關(guān)于同一反射面的橢圓約束,這組橢圓的公切線則對應(yīng)于反射面的位置。于是由式(4)有
由于AIR中的TOA信息受噪聲和混響干擾,式(9)得到的結(jié)果不能保證對應(yīng)于真實的反射面。充分利用聲傳播的多徑TOA信息,并采用可信度判斷與霍夫變換結(jié)合的方式,可避免TOA模糊問題的復(fù)雜求解,提高反射面估計的魯棒性。具體步驟如下:(1) 通過在聲場中不同位置放置聲源,得到更多數(shù)據(jù)來源。(2) 將聲源靠近反射面,以保證AIR中直達之后的第一個脈沖即為來自該反射面的一階反射,用于3.1節(jié)中的初始估計;(3) 選取AIR中除直達外的多徑TOA,通過可信度判斷剔除與指定反射面無關(guān)的TOA項,得到可信反射點集合,再利用霍夫變換的點線轉(zhuǎn)換特性得到修正后更接近真實反射面的位置估計。
3.2.1 可信度分析
圖3 直線橢圓位置關(guān)系與反射點選取
圖4 反射點候選點集選取流程圖
3.2.2 霍夫變換
不同噪聲標(biāo)準差情況下聲源的平均定位誤差如表1所示。
表1 聲源定位平均誤差
圖7 初始估計與加入3個多徑TOA后的修正性能對比
實際環(huán)境中的AIR多為鋸齒波形,因此對其包絡(luò)進行峰值檢測,其他參數(shù)設(shè)置參照4.1節(jié)。
圖8 真實環(huán)境中不同收發(fā)位置的聲學(xué)脈沖響應(yīng)
表2 真實環(huán)境聲源定位誤差
表3 真實環(huán)境墻體估計誤差
針對現(xiàn)有室內(nèi)建圖技術(shù)存在的高成本、高計算復(fù)雜度等缺點,本文提出了一種基于AIR的定位與建圖一步完成的方法。該方法首先在異步情況下通過聲源定位得到準確的TOA;再根據(jù)橢圓幾何約束關(guān)系,通過COTA算法對反射面進行初始估計;最后通過可信度判斷與霍夫變換結(jié)合的方式篩選多徑TOA,對初始估計進行修正。蒙特卡洛模擬實驗和真實房間實驗表明,該方法能夠在存在噪聲及混響的室內(nèi)環(huán)境中重構(gòu)房間二維幾何地圖,且通過可信度判斷與霍夫變換結(jié)合的方式提升了算法的魯棒性。
原始的霍夫變換需要大量的候選點集支撐,但大量選取多徑TOA也加大了計算量。下一步將對霍夫變換算法進行改進,加強其在少量數(shù)據(jù)情況下的抗噪能力;或是選擇并改進篩選可信低階TOA的方法,使其更加高效。
[1] KOLODZIEJ K W, HJELM J. Local positioning systems: LBS applications and services[M]//Local Positioning System, LBS Applications and Services, 2006: 101-158.
[2] 趙銳, 鐘榜, 朱祖禮, 等. 室內(nèi)定位技術(shù)及應(yīng)用綜述[J]. 電子科技, 2014, 27(3): 154.
ZHAO Rui, ZHONG Bang, ZHU Zuli, et al. Overview of indoor positioning technology and application[J]. Electronic Science & Technology, 2014, 27(3): 154.
[3] FUENTES-PACHECO J, RUIZ-ASCENCIO J, RENDóN- MANCHA J M. Visual simultaneous localization and mapping: a survey[J]. Artificial Intelligence Review, 2015, 43(1): 55-81.
[4] 劉建華, 劉華平, 楊建國, 等. 測距式傳感器同時定位與地圖創(chuàng)建綜述[J]. 智能系統(tǒng)學(xué)報, 2015, 10(5): 655-662.
LIU Jianhua, LIU Huaping, YANG Jianguo, et al. Overview of simultaneous location and map creation of ranging sensors[J]. Journal of Intelligent Systems, 2015, 10(5): 655-662.
[5] 吳碩賢, 趙越喆. 室內(nèi)聲學(xué)與環(huán)境聲學(xué)[M]. 廣州: 廣東科技出版社, 2003.
WU Shuoxian, ZHAO Yuezhe. Room acoustics and environmental acoustics[M]. Guangzhou: Guangdong Science & Technology Press, 2003.
[6] MOORE A H, BROOKES M, NAYLOR P A. Room geometry estimation from a single channel acoustic impulse response[C]// Signal Processing Conference. IEEE, 2014: 1-5.
[7] MARKOVICA D, ANTONACCI F, SARTI A, et al. Estimation of room dimensions from a single impulse response[C]//Applications of Signal Processing To Audio and Acoustics, IEEE, 2014: 1-4.
[8] 石婷. 麥克風(fēng)陣列聲源定位算法研究綜述[J]. 科技視界, 2016(27): 274-274.
SHI Ting. Review of research on microphone array sound source localization algorithm[J]. Science and Technology Vision, 2016(27): 274-274.
[9] DOKMANI? I, DAUDET L, VETTERLI M. From acoustic room reconstruction to slam[C]//IEEE International Conference on Acoustics, Speech and Signal Processing, IEEE, 2016: 6345-6349.
[10] REMAGGI L, JACKSON P J B, COLEMAN P, et al. Room boundary estimation from acoustic room impulse responses[C]//Sensor Signal Processing for Defence, IEEE, 2014: 1-5.
[11] ANTONACCI F, FILOS J, THOMAS M R P, et al. Inference of Room Geometry From Acoustic Impulse Responses[J]. IEEE Transactions on Audio Speech & Language Processing, 2012, 20(10): 2683-2695.
[12] NASERI H, KOIVUNEN V. Cooperative simultaneous localization and mapping by exploiting multipath propagation[J]. IEEE Transactions on Signal Processing, 2016, 65(1): 200-211.
[13] MENSING C, PLASS S. Positioning algorithms for cellular networks using TDOA[C]//IEEE International Conference on Acoustics Speech and Signal Processing Proceedings. IEEE, 2006: IV-IV.
[14] FILOS J, CANCLINI A, THOMAS M R P, et al. Robust inference of room geometry from acoustic measurements using the hough transform[C]//Signal Processing Conference, 2011, European. IEEE, 2010: 161-165.
[15] 金博楠, 徐曉蘇, 張濤, 等. 基于TDOA定位的陣列布放結(jié)構(gòu)研究[J]. 導(dǎo)航定位與授時, 2017, 4(6): 29-36.
JIN Bonan, XU Xiaosu, ZHANG Tao, et al. Research on array placement structure based on TDOA positioning[J]. Navigation and Timing, 2017, 4(6): 29-36.
[16] 覃虹菱. 基于聲學(xué)脈沖響應(yīng)的麥克風(fēng)陣列室內(nèi)幾何重構(gòu)關(guān)鍵技術(shù)研究[D]. 桂林: 桂林電子科技大學(xué), 2019.
[17] DUDA R O, HART P E. Use of the Hough transformation to detect lines and curves in pictures[J]. Cacm, 1972, 15(1): 11-15.
[18] ALLEN J B, BERKLEY D A. Image method for efficiently simulating small‐room acoustics[J]. J. Acoust. Soc. Am., 2016, 65(S1): 943-950.
[19] FARINA A. Simultaneous measurement of impulse response and distortion with a swept-sine technique[J]. Proc. Conv. Audio Eng. Soc. Paris, 2000, 24: 18-22.
Research on indoor mapping algorithm based on acoustic impulse response
QIN Hongling1, WANG Mei1,2, SONG Xiyu1, ZHOU Zou1, LUO Liyan1
(1. Provincial Ministry of Education Key Laboratory of Cognitive Radio and Signal Processing, Guilin University of Electronic Technology, Guilin 541004, Guangxi, China; 2. School of Information Science and Engineering, Guilin University of Technology, Guilin 541004, Guangxi, China)
The existing indoor mapping technology has the shortcomings in high cost and high computational complexity, which is caused by the TOA (time of arrival) ambiguity of the acoustic impulse response (AIR) due to noise and reverberation in the indoor environment. To solve this problem, an indoor localization and mapping method based on combining AIR credibility judgment and Hough transform is proposed in this paper. Firstly, the method iteratively estimates the position of the sound source based on the Time Difference of Arrival (TDOA) and calculates the accurate TOA. Then, by using the elliptical constraint relationship between the acoustic transceiver and the first-order reflection TOA on the reflective surface and combining the credibility judgment and Hough Transform, the reliable low-order TOA is selected to achieve the two-dimensional position estimation of the indoor reflective surface. Monte Carlo simulation results show that in the complex indoor environment of 10m×8m×4m with reverberation time60of 0.134 7 s and AIR error standard deviation of 22.7×10-3ms, the average distance error of wall localization is 10.1cm, and the average angular error is 2.795 8°. In the following experiments in a real room of 5.26 m×3.5 m×3.35 m, this method can realize the simultaneous localization of sound source and wall position, and complete the two-dimensional reconstruction of a box-type room. And the average distance error of wall localization is 2.6 cm, and the average angular error is 2.17°.
acoustic impulse response (AIR); indoor localization and mapping; elliptic constraint; Hough transform
TU112
A
1000-3630(2020)-02-0243-08
10.16300/j.cnki.1000-3630.2020.02.020
2018-11-03;
2018-12-29
國家自然科學(xué)基金 (61771151)、廣西重點研發(fā)計劃項目(AB17292058)、廣西自然科學(xué)基金(2016GXNSFBA38014)、中國博士后科學(xué)基金(2016M602921XB)、廣西高校無人機遙測重點實驗室開放基金(WRJ2016KF01)資助項目
覃虹菱(1994-), 女, 四川成都人, 碩士研究生, 研究方向為室內(nèi)定位與建圖。
宋浠瑜,E-mail: songxiyu@guet.edu.cn