陳扶明 李 盛 安 強(qiáng) 張自啟 王健琪*
①(第四軍醫(yī)大學(xué)生物醫(yī)學(xué)工程學(xué)院 西安 710032)
②(西京學(xué)院控制工程學(xué)院 西安 710123)
生物雷達(dá)語(yǔ)音信號(hào)探測(cè)技術(shù)研究進(jìn)展
陳扶明①李 盛②安 強(qiáng)①?gòu)堊詥ⅱ偻踅$?①
①(第四軍醫(yī)大學(xué)生物醫(yī)學(xué)工程學(xué)院 西安 710032)
②(西京學(xué)院控制工程學(xué)院 西安 710123)
語(yǔ)音信號(hào)的獲取對(duì)人類(lèi)進(jìn)行交流具有重要意義。生物雷達(dá)技術(shù)具有非接觸、非侵入、安全、方向性好、靈敏度高、抗干擾能力強(qiáng),并具有一定穿透性等多種優(yōu)點(diǎn),在語(yǔ)音信號(hào)探測(cè)領(lǐng)域具有重要應(yīng)用前景。該文首先回顧了語(yǔ)音探測(cè)技術(shù)的發(fā)展歷程,然后綜述了生物雷達(dá)語(yǔ)音探測(cè)技術(shù)的研究現(xiàn)狀,給出了生物雷達(dá)探測(cè)語(yǔ)音信號(hào)的基本原理,并對(duì)3種不同體制的生物雷達(dá)語(yǔ)音探測(cè)系統(tǒng)性能進(jìn)行了對(duì)比闡述。最后對(duì)生物雷達(dá)語(yǔ)音信號(hào)探測(cè)技術(shù)的應(yīng)用前景進(jìn)行了展望。
生物雷達(dá);語(yǔ)音探測(cè);語(yǔ)音信號(hào);聲學(xué)傳感器
語(yǔ)音信號(hào)是人體重要的生理信號(hào)之一,也是人類(lèi)進(jìn)行交流必不可少的信息交流手段。因此,研究語(yǔ)音信號(hào)的有效探測(cè)技術(shù)具有重要意義。目前,語(yǔ)音信號(hào)的探測(cè)技術(shù)按聲波的傳播媒介可分為空氣傳導(dǎo)和非空氣傳導(dǎo)技術(shù)兩類(lèi)??諝鈧鲗?dǎo)探測(cè)技術(shù)的主要代表是傳統(tǒng)麥克風(fēng)傳感器,其原理是語(yǔ)音信號(hào)的振動(dòng)傳遞到麥克風(fēng)振膜上,將變動(dòng)的壓力波轉(zhuǎn)換為電信號(hào)而獲取語(yǔ)音信號(hào)的裝置,已被廣泛應(yīng)用于人類(lèi)生活的諸多領(lǐng)域。然而,該探測(cè)技術(shù)極易受到周?chē)h(huán)境噪聲和聲音噪聲的干擾,而且該語(yǔ)音探測(cè)技術(shù)的探測(cè)距離較短。接觸式非空氣傳導(dǎo)探測(cè)技術(shù)以喉部送話(huà)器為代表,它將喉部送話(huà)器緊貼使用者的喉部,使用者說(shuō)話(huà)時(shí)聲帶振動(dòng),引起喉部送話(huà)器電壓發(fā)聲變化,使得振動(dòng)信號(hào)轉(zhuǎn)換為語(yǔ)音信號(hào)。該探測(cè)技術(shù)的優(yōu)點(diǎn)在于空氣傳導(dǎo)的聲波對(duì)其無(wú)影響,因此,該類(lèi)探測(cè)裝置具有較強(qiáng)的抗噪聲干擾能力。然而,像喉部送話(huà)器等非空氣傳導(dǎo)探測(cè)技術(shù)需要緊貼人體皮膚,往往使人體活動(dòng)受到限制且舒適度較低。激光多普勒語(yǔ)音探測(cè)技術(shù)作為非接觸式非空氣傳導(dǎo)語(yǔ)音探測(cè)技術(shù),已有學(xué)者將此方法成功應(yīng)用語(yǔ)音探測(cè)中。雖然激光、紅外等光學(xué)語(yǔ)音探測(cè)傳感器能夠?qū)崿F(xiàn)遠(yuǎn)距離無(wú)接觸探測(cè),但是這類(lèi)光學(xué)傳感器極易受溫度、氣候等環(huán)境因素影響。以上語(yǔ)音探測(cè)技術(shù)各自的缺點(diǎn)制約了人體語(yǔ)音信號(hào)的獲取。
近年來(lái),一種新的非接觸式的生命探測(cè)技術(shù)逐漸得到廣泛重視,該探測(cè)技術(shù)不受環(huán)境溫度、氣候等條件的影響,能夠非接觸、非侵入、安全、高靈敏度、高方向性的探測(cè)遠(yuǎn)距離物體微動(dòng)信號(hào)。國(guó)內(nèi)外學(xué)者稱(chēng)該技術(shù)為“生物雷達(dá)”。生物雷達(dá)技術(shù)自提出以來(lái),已在人體生命體征呼吸、心跳等檢測(cè)方面得到了廣泛應(yīng)用,并取得了較好的成果。而將其應(yīng)用于語(yǔ)音信號(hào)探測(cè)是一項(xiàng)較新的研究。
2.1 空氣傳導(dǎo)式語(yǔ)音探測(cè)技術(shù)
早在1857年,法國(guó)發(fā)明家斯科特發(fā)明了一種語(yǔ)音描記器,第1次將聲音記錄到固定的媒介中,該裝置的發(fā)明成為了傳統(tǒng)語(yǔ)音探測(cè)技術(shù)麥克風(fēng)傳感器發(fā)展的開(kāi)端。1925年,貝爾實(shí)驗(yàn)室中的E.C.Wente等人研究出第1支電容式麥克風(fēng)[1],它有足夠的靈敏度與頻寬可將各種聲音轉(zhuǎn)換成電氣訊號(hào),該麥克風(fēng)成了當(dāng)時(shí)實(shí)用可行的原始電氣錄音設(shè)備。在這之后,很多學(xué)者開(kāi)始致力于麥克風(fēng)語(yǔ)音探測(cè)裝置的研究,電動(dòng)式,壓電、壓敏電阻式,接觸式等麥克風(fēng)語(yǔ)音探測(cè)技術(shù)應(yīng)運(yùn)而生[2];例如,1983年Royer等利用硅微機(jī)械加工技術(shù)研制了一種壓電式麥克風(fēng)[3],該麥克風(fēng)具有較高的靈敏度和較寬的頻率范圍。1997年,Pedersen等用新材料聚酰亞胺研制了一種硅電容式麥克風(fēng)[4]。2001年,Kronast等研制了一種高度敏感的氮化硅膜的硅電容式麥克風(fēng)[5]。
麥克風(fēng)語(yǔ)音探測(cè)技術(shù)經(jīng)過(guò)不斷的發(fā)展,無(wú)論在設(shè)計(jì)還是探測(cè)性能方面都得到了很大發(fā)展,并且已廣泛應(yīng)用于人類(lèi)生活各個(gè)方面。然而,麥克風(fēng)語(yǔ)音探測(cè)技術(shù)在獲取有用信號(hào)的同時(shí),大量聲學(xué)噪聲往往也被捕獲,這些噪聲信號(hào)極大地降低了語(yǔ)音信號(hào)的質(zhì)量。因此,周?chē)h(huán)境噪聲干擾在一定程度上限制了靠空氣傳導(dǎo)的語(yǔ)音探測(cè)技術(shù)的發(fā)展。
2.2 非空氣傳導(dǎo)接觸式語(yǔ)音探測(cè)技術(shù)
1986年,Ingalls發(fā)明了一種名為喉部送話(huà)器的語(yǔ)音探測(cè)裝置,并申請(qǐng)了專(zhuān)利[6]。該非空氣傳導(dǎo)的接觸式語(yǔ)音探測(cè)技術(shù)主要是將喉部送話(huà)器緊貼人體喉部,當(dāng)人體發(fā)音時(shí)聲帶的振動(dòng)會(huì)引起喉部皮膚振動(dòng),該振動(dòng)信號(hào)傳遞到喉部送話(huà)器后,喉部送話(huà)器可將該振動(dòng)信號(hào)轉(zhuǎn)化為電信號(hào),即得到語(yǔ)音信號(hào)。喉部送話(huà)器語(yǔ)音探測(cè)技術(shù)不受空氣傳導(dǎo)噪聲的影響,具有較強(qiáng)的抗噪聲干擾能力。因此,在飛機(jī)、坦克等環(huán)境噪聲較大的場(chǎng)合得到了廣泛應(yīng)用。為了提高在強(qiáng)噪聲環(huán)境下的語(yǔ)音識(shí)別能力,Shahina等用喉部送話(huà)器進(jìn)行了語(yǔ)音識(shí)別研究,實(shí)驗(yàn)結(jié)果表明基于喉部送話(huà)器的語(yǔ)音識(shí)別系統(tǒng)在強(qiáng)噪聲環(huán)境下具有較好的識(shí)別效果[7]。
另一類(lèi)非空氣傳導(dǎo)的接觸式語(yǔ)音探測(cè)典型裝置是骨傳導(dǎo)麥克風(fēng)[8]。骨傳導(dǎo)麥克風(fēng)是將聲帶的振動(dòng)經(jīng)過(guò)顱骨傳輸給麥克風(fēng),從而獲得語(yǔ)音信號(hào)。該探測(cè)技術(shù)的優(yōu)點(diǎn)在于聲波信號(hào)的采集與現(xiàn)場(chǎng)周?chē)沫h(huán)境噪聲毫無(wú)關(guān)系,因此,可以有效獲取高質(zhì)量語(yǔ)音信號(hào)。1986年,Hough等人研制了一種骨傳導(dǎo)助聽(tīng)器設(shè)備,用于克服由于內(nèi)耳損傷、病變等造成的聲音傳導(dǎo)機(jī)制受阻造成的聽(tīng)力損失[9]。2013年,張杰將骨傳導(dǎo)聽(tīng)說(shuō)技術(shù)應(yīng)用于煤礦應(yīng)急救援,提高了煤礦應(yīng)急救援的安全性和可靠性[10]。
以上研究表明,喉部送話(huà)器和骨傳導(dǎo)麥克風(fēng)等非空氣傳導(dǎo)的接觸式語(yǔ)音探測(cè)技術(shù)具有較強(qiáng)的抗環(huán)境噪聲干擾能力,在強(qiáng)噪聲環(huán)境下具有較好的應(yīng)用前景。然而,這類(lèi)語(yǔ)音探測(cè)裝置常常佩戴于人體喉部或者頭部,需要與人體直接接觸,極大地限制了人體的自由活動(dòng),而且長(zhǎng)時(shí)間佩戴會(huì)影響人體舒適度,此外,該類(lèi)裝置在一些特殊場(chǎng)合會(huì)增加人們的緊張情緒。
2.3 非空氣傳導(dǎo)非接觸式語(yǔ)音探測(cè)技術(shù)
近年來(lái),一種非空氣傳導(dǎo)非接觸式的光學(xué)探測(cè)技術(shù)得到了發(fā)展,這類(lèi)探測(cè)技術(shù)能夠克服靠空氣傳導(dǎo)和非空氣傳導(dǎo)接觸式語(yǔ)音探測(cè)技術(shù)的缺點(diǎn),具有遠(yuǎn)距離、抗干擾、非接觸式探測(cè)等優(yōu)點(diǎn),已有學(xué)者將其應(yīng)用于語(yǔ)音信號(hào)的檢測(cè)。2006年,Li等人將激光多普勒測(cè)振儀(LDV)應(yīng)用于語(yǔ)音信號(hào)探測(cè),并利用維納濾波對(duì)激光語(yǔ)音信號(hào)進(jìn)行了增強(qiáng)[11]。2011年,Avargel等人利用激光多普勒測(cè)振儀進(jìn)行了語(yǔ)音探測(cè)實(shí)驗(yàn)研究,實(shí)驗(yàn)結(jié)果表明當(dāng)激光波束對(duì)準(zhǔn)人體喉部時(shí),該語(yǔ)音探測(cè)裝置可以探測(cè)到頻率上限為1.5~2.0 kHz的語(yǔ)音信號(hào)[12]。尚建華等人在聲源前放置一塊玻璃,進(jìn)行了利用激光多普勒測(cè)振儀探測(cè)由聲源振動(dòng)引起玻璃振動(dòng)的聲音信號(hào)實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明:該探測(cè)技術(shù)可以獲得25 m以外的語(yǔ)音信號(hào)[13]。
以上研究表明光學(xué)語(yǔ)音探測(cè)技術(shù)能夠有效探測(cè)到遠(yuǎn)距離的語(yǔ)音信號(hào)。然而,這類(lèi)語(yǔ)音探測(cè)技術(shù)存在光路對(duì)準(zhǔn)困難,易受溫度等環(huán)境條件影響[14],而且這類(lèi)光學(xué)材料往往價(jià)格昂貴,往往難以獲得[15],此外,使用激光危險(xiǎn)性較大,當(dāng)激光輸出功率在5 mW以上時(shí),已處于激光安全等級(jí)的3a級(jí)[16]。這些不足在一定程度上阻礙了光學(xué)語(yǔ)音探測(cè)技術(shù)的發(fā)展。因此,迫切需要研制一種更新的語(yǔ)音探測(cè)技術(shù),能夠克服上述語(yǔ)音探測(cè)技術(shù)存在的缺點(diǎn),且可以有效獲得語(yǔ)音信號(hào)的探測(cè)方法。
基于生物雷達(dá)的非接觸信號(hào)探測(cè)技術(shù)以電磁波為探測(cè)媒介,當(dāng)電磁波到達(dá)人體時(shí),經(jīng)人體生理活動(dòng)引起的體表微動(dòng)調(diào)制,引起電磁波相位、頻率發(fā)聲改變,通過(guò)對(duì)接收的雷達(dá)回波信號(hào)進(jìn)行解調(diào),即可獲得人體生理信號(hào)。1971年Caro等首次利用連續(xù)波體制雷達(dá)監(jiān)測(cè)人體呼吸[17],自此廣大研究者開(kāi)始將其應(yīng)用人體生命體征的監(jiān)測(cè)[18–21]。此外,將生物雷達(dá)應(yīng)用于語(yǔ)音信號(hào)探測(cè)作為一種新技術(shù)也得到很多研究者的關(guān)注。
據(jù)文獻(xiàn)報(bào)道,將生物雷達(dá)應(yīng)用于語(yǔ)音信號(hào)探測(cè)研究的開(kāi)端是1996年,中國(guó)東南大學(xué)黎宗文等首次利用40 GHz毫米波雷達(dá)成功探測(cè)到自由空間人體語(yǔ)音信號(hào)[15]。同時(shí)他提出60 GHz或者90 GHz等更高頻的毫米波將在語(yǔ)音信號(hào)獲取方面優(yōu)于40 GHz毫米波雷達(dá)。然而并沒(méi)有從根本上回答該技術(shù)探測(cè)語(yǔ)音的原理,后續(xù)也無(wú)更新報(bào)道。
1994年,McEwan研制出一種低功率電磁波(ElectroMagnetic Wave, EMW)雷達(dá)傳感器,并申請(qǐng)了發(fā)明專(zhuān)利[22],該雷達(dá)具有低功耗、非侵入性、安全、快速、便攜、低成本等優(yōu)點(diǎn)。1996年Holzrichter等將該EM雷達(dá)傳感器應(yīng)用于語(yǔ)音的編碼、識(shí)別及合成[23]。1997年,該課題組又將該EM雷達(dá)傳感器應(yīng)用于人體發(fā)聲器官的測(cè)量[24]。在此項(xiàng)研究中,他們用一個(gè)工作頻率為2.3 GHz,輸出功率為毫瓦級(jí)的EM雷達(dá)傳感器測(cè)量人體發(fā)音時(shí)聲帶、嘴唇、下巴、舌頭等聲道組織的運(yùn)動(dòng)。并與電聲門(mén)圖(Electroglottography)測(cè)量結(jié)果進(jìn)行了對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)發(fā)現(xiàn)EM雷達(dá)傳感器和電聲門(mén)圖測(cè)量結(jié)果具有一致性。此外,該研究還說(shuō)明EM傳感器在語(yǔ)音識(shí)別、合成、診斷等與語(yǔ)音相關(guān)的研究方面具有重要的應(yīng)用前景。1999年,Burnett等人用EM雷達(dá)傳感器檢測(cè)人體發(fā)聲時(shí)氣管后壁組織的運(yùn)動(dòng)[25]。他們用雷達(dá)探測(cè)的氣管后壁組織運(yùn)動(dòng)信號(hào)確定聲道的聲音激勵(lì)函數(shù),從而計(jì)算出準(zhǔn)確的基音信息。用獲取的激勵(lì)函數(shù)和錄制的音頻信號(hào)確定聲道振動(dòng)的傳遞函數(shù)。研究表明由此確定的傳遞函數(shù)可以作為新的特征向量提高語(yǔ)音識(shí)別器和合成器的性能。此外,由于EM雷達(dá)傳感器在檢測(cè)聲門(mén)運(yùn)動(dòng)方面具有較好的應(yīng)用前景,Burnett等命名這種EM雷達(dá)傳感器為GEMS(Glottal Electromagnetic Micropower Sensors)。2000年,該研究組將GEMS信號(hào)和聲音信號(hào)相結(jié)合有效去除了聲音信號(hào)中的噪聲[26]。Titze等人通過(guò)實(shí)驗(yàn)對(duì)比發(fā)現(xiàn)將EM雷達(dá)傳感器放置于靠近人體喉部附近時(shí),EM雷達(dá)傳感器測(cè)量的振動(dòng)信號(hào)與電聲門(mén)圖具有較高的相似性[27]。2002年,Staderini等人用超寬譜(Ultra WideBand, UWB)雷達(dá)對(duì)人體心臟運(yùn)動(dòng)、人體發(fā)聲功能等進(jìn)行了評(píng)估和監(jiān)測(cè)[28]。為了進(jìn)一步驗(yàn)證EM雷達(dá)傳感器所測(cè)量發(fā)聲器官振動(dòng)的信號(hào)源,2005年,Holzrichter通過(guò)一組特殊實(shí)驗(yàn)驗(yàn)證了EM雷達(dá)傳感器所探測(cè)的發(fā)聲器官的振動(dòng)源主要是聲帶[29]。
2009年,Ahmed和Wallace等人用UWB雷達(dá)對(duì)唇、舌頭、聲門(mén)等器官的位置和運(yùn)動(dòng)進(jìn)行探測(cè),并通過(guò)實(shí)驗(yàn)說(shuō)明了超寬譜語(yǔ)音感知技術(shù)在語(yǔ)音合成、語(yǔ)音識(shí)別等研究中的有效性[30]。
2010年,臺(tái)灣國(guó)立中正大學(xué)張盛富教授課題組,用發(fā)射頻率為925 MHz的零差拍連續(xù)波雷達(dá)探測(cè)人體說(shuō)話(huà)時(shí)聲帶振動(dòng)信號(hào)。在實(shí)驗(yàn)中,雷達(dá)與麥克風(fēng)同步采集人體聲帶振動(dòng)信號(hào),實(shí)驗(yàn)結(jié)果表明,該雷達(dá)能夠有效探測(cè)人體說(shuō)話(huà)時(shí)聲帶振動(dòng)信號(hào)[31]。
以上研究表明生物雷達(dá)技術(shù)在聲道發(fā)音器官測(cè)量方面得到了廣泛的應(yīng)用,并取得了一定的研究成果。除此之外,有學(xué)者將生物雷達(dá)技術(shù)應(yīng)用于語(yǔ)音增強(qiáng)、語(yǔ)音端點(diǎn)檢測(cè)以及聲音信號(hào)的測(cè)量。2004年Hu用GEMS和聲音傳感器同步采集語(yǔ)音信號(hào),然后用聲門(mén)相關(guān)性(Glottis CORRelation, GCORR)方法對(duì)單聲道的語(yǔ)音信號(hào)進(jìn)行增強(qiáng),實(shí)驗(yàn)結(jié)果表明GCORR能夠有效增強(qiáng)低信噪比時(shí)的語(yǔ)音信號(hào)[32]。2005年,該研究小組用一種聲音多普勒雷達(dá)有效區(qū)分了人體語(yǔ)音的發(fā)聲段和靜默段[33],實(shí)驗(yàn)表明該雷達(dá)可以有效提高語(yǔ)音端點(diǎn)檢測(cè)性能。然而,文獻(xiàn)對(duì)該聲音多普勒雷達(dá)系統(tǒng)未做詳細(xì)的闡述。2006年,Quatieri等人將多傳感器(GEMS、骨傳導(dǎo)麥克風(fēng)、生理麥克風(fēng)、EGG)信息融合,有效地提高了語(yǔ)音編碼器在強(qiáng)噪聲環(huán)境下的可懂度[34]。2005年,Anderson研究組將GEMS應(yīng)用于線性語(yǔ)音編碼器(Mixed Excitation Linear Prediction, MELP)的語(yǔ)音增強(qiáng)[35]。Xiao等人用一種低功率的Ka波段多普勒雷達(dá)探測(cè)人體呼吸和心跳信號(hào),并取得較好的效果,此外,他們通過(guò)改變?yōu)V波電路對(duì)聲音信號(hào)進(jìn)行了探測(cè)實(shí)驗(yàn),實(shí)驗(yàn)表明該雷達(dá)可以檢測(cè)到100 Hz的聲音信號(hào)[36]。
以上關(guān)于生物雷達(dá)探測(cè)技術(shù)的應(yīng)用研究充分說(shuō)明了雷達(dá)傳感器在語(yǔ)音探測(cè)方面的可行性和有效性。然而這些研究的重心主要是測(cè)量人體發(fā)音器官的運(yùn)動(dòng),然而將雷達(dá)傳感器直接應(yīng)用于人體語(yǔ)音信號(hào)的探測(cè)未見(jiàn)詳細(xì)報(bào)道。
第四軍醫(yī)大學(xué)王健琪教授領(lǐng)導(dǎo)的課題組從1998年開(kāi)始了連續(xù)波雷達(dá)語(yǔ)音探測(cè)技術(shù)的研究。該課題組于2006年研制出第1代非接觸式雷達(dá)語(yǔ)音探測(cè)平臺(tái),該雷達(dá)能成功探測(cè)到自由空間人體語(yǔ)音信號(hào)[37]。由于第1代雷達(dá)語(yǔ)音探測(cè)系統(tǒng)容易因電磁耦合而產(chǎn)生信號(hào)形變,因此該體制雷達(dá)探測(cè)到的語(yǔ)音信號(hào)質(zhì)量較差。為解決第1代雷達(dá)語(yǔ)音探測(cè)系統(tǒng)存在的不足,該課題組于2007年研制了第2代雷達(dá)語(yǔ)音探測(cè)系統(tǒng)[38]。第2代雷達(dá)語(yǔ)音探測(cè)系統(tǒng)采用超外差式雙天線結(jié)構(gòu),在探測(cè)性能方面較第1代雷達(dá)語(yǔ)音探測(cè)系統(tǒng)有了較明顯的提高。然而,以上兩代生物雷達(dá)語(yǔ)音探測(cè)技術(shù)存在采集的語(yǔ)音信號(hào)高頻分量不充分,可懂度低等問(wèn)題。文獻(xiàn)[39]提出,在生理信號(hào)探測(cè)方面,與Ka波段的雷達(dá)相比,W波段(75~110 GHz)雷達(dá)能夠在探測(cè)范圍和靈敏度兩方面提供一個(gè)最佳折衷。因此,該課題組在2013年以來(lái),采用了一種基于94 GHz的生物雷達(dá)進(jìn)行語(yǔ)音探測(cè)技術(shù)的研究[40]。
假設(shè)連續(xù)波雷達(dá)發(fā)射天線發(fā)射的單頻信號(hào)為:
其中,A是發(fā)射信號(hào)振動(dòng)幅度,f0是發(fā)射信號(hào)的頻率,θ1是初始相位。當(dāng)發(fā)射信號(hào)到達(dá)與其距離為d0的人體喉部時(shí),由d0引起的回波信號(hào)相位變化為θ2,經(jīng)人體喉部振動(dòng)x(t)調(diào)制引起回波信號(hào)相位變化為4πx(t)/λ0,則接收天線接收的回波信號(hào)可表示為:
其中,λ0=c/f0, c是光速,K是發(fā)射信號(hào)振動(dòng)幅度的衰減系數(shù)。雷達(dá)回波信號(hào)與發(fā)射信號(hào)進(jìn)行混頻:
經(jīng)低通濾波、濾除直流后可得基帶信號(hào)為:
其中,Δθ是由發(fā)射信號(hào)與喉部距離d0產(chǎn)生的相位偏移。當(dāng)人體喉部微動(dòng)所引起的位移x(t)遠(yuǎn)小于雷達(dá)波長(zhǎng)時(shí),且Δθ是π/2奇數(shù)倍時(shí),基帶信號(hào)可以表示為:
此時(shí),人體喉部振動(dòng)的信息即包含于解調(diào)后基帶信號(hào)中,通過(guò)處理即可獲得語(yǔ)音信號(hào)。
5.1 生物雷達(dá)語(yǔ)音探測(cè)系統(tǒng)
人體發(fā)聲時(shí)喉部振動(dòng)幅度為毫米級(jí),由式(5)可知當(dāng)雷達(dá)波的波長(zhǎng)較短時(shí),才能夠有效的解調(diào)出語(yǔ)音信號(hào),又根據(jù)文獻(xiàn)[15]的實(shí)驗(yàn)研究啟示,本課題組研制了毫米波體制雷達(dá)進(jìn)行語(yǔ)音探測(cè)技術(shù)研究。毫米波雷達(dá)即波長(zhǎng)為1~10 mm電磁波,毫米波雷達(dá)具有分辨率高、抗干擾能力強(qiáng)以及方向性好等優(yōu)點(diǎn)。然而,毫米波在空氣中傳播會(huì)受到水蒸氣H2O和氧分子O2吸收和散射,從而造成電磁波的衰減。這些氣體分子對(duì)某些頻率的毫米波吸收較多而造成雷達(dá)波衰減的現(xiàn)象,稱(chēng)為在該頻率的“吸收峰”。因此,在這些“吸收峰”附近頻段的毫米波會(huì)嚴(yán)重衰減。在這些“吸收峰”頻段內(nèi)存在衰減為極小值的頻段,我們稱(chēng)這些極小值頻段為毫米波的“大氣窗口”,這些窗口的中心頻率有35 GHz, 94 GHz, 140 GHz和220 GHz[41]。
本課題組于2006年研制出第1代非接觸式語(yǔ)音探測(cè)平臺(tái)。生物雷達(dá)語(yǔ)音探測(cè)技術(shù)的主要組成部分是雷達(dá)收發(fā)前端系統(tǒng),雷達(dá)收發(fā)前端系統(tǒng)體制和工作模式不同,語(yǔ)音信號(hào)的獲取能力也不同。第1代實(shí)驗(yàn)平臺(tái)為零差拍體制[37],發(fā)射頻率為34 GHz的連續(xù)波雷達(dá),其收發(fā)前端框圖如圖1所示。
圖1 零差拍雷達(dá)系統(tǒng)收發(fā)前端框圖Fig. 1 Block diagram of transceiver front-end for the homodyne radar system
當(dāng)壓控振蕩器(VCO)產(chǎn)生正弦連續(xù)波信號(hào),經(jīng)定向耦合器將該信號(hào)分為兩路,一路作為輻射輸出信號(hào),一路作為本振信號(hào)。輻射輸出信號(hào)經(jīng)環(huán)形器和調(diào)配器輸送至天線。發(fā)射信號(hào)到達(dá)人體喉部,經(jīng)反射由天線接收。接收信號(hào)經(jīng)調(diào)配器和環(huán)形器后送入混頻器并與本振信號(hào)進(jìn)行差拍形成差拍信號(hào),差拍信號(hào)經(jīng)后端系統(tǒng)處理后獲得語(yǔ)音信號(hào)。
該雷達(dá)系統(tǒng)工作參數(shù)如表1所示。
表1 零差拍雷達(dá)系統(tǒng)工作參數(shù)Tab. 1 Working parameters of the homodyne radar system
基于零差拍體制雷達(dá)的收發(fā)前端系統(tǒng)容易受定向耦合器、環(huán)形器、調(diào)配器等的影響。且該體制語(yǔ)音探測(cè)系統(tǒng)采用單天線作為接發(fā)天線,因此,發(fā)射信號(hào)和接收信號(hào)無(wú)法被環(huán)形器完全隔離,此時(shí)部分發(fā)射信號(hào)會(huì)進(jìn)入接收機(jī),從而影響語(yǔ)音探測(cè)質(zhì)量。
針對(duì)第1代雷達(dá)語(yǔ)音探測(cè)系統(tǒng)的缺點(diǎn)。2007年,本課題組研制了第2臺(tái)雷達(dá)語(yǔ)音探測(cè)技術(shù)。該實(shí)驗(yàn)平臺(tái)為超外差連體制[38],發(fā)射頻率為35.5 GHz。該雷達(dá)收發(fā)前端框圖如圖2所示。
圖2 超外差雷達(dá)系統(tǒng)收發(fā)前端框圖Fig. 2 Block diagram of transceiver front-end for the superheterodyne radar system
該超外差體制雷達(dá)前端收發(fā)系統(tǒng)主要由壓控振蕩器、晶振源、上變頻器、下變頻器、混頻器、功分器、中頻放大器、低噪聲放大器、接收天線和發(fā)射天線構(gòu)成。在發(fā)射端,首先由壓控振動(dòng)器(VCO)產(chǎn)生頻率為34.5 GHz的正弦信號(hào),與晶振源產(chǎn)生的1 GHz的信號(hào)進(jìn)行上變頻得到35.5 GHz信號(hào),經(jīng)過(guò)濾波電路將其注入發(fā)聲機(jī)通過(guò)發(fā)射天線發(fā)射出工作頻率為35.5 GHz的電磁波。在接收端,當(dāng)電磁波經(jīng)人體喉部皮膚振動(dòng)反射,接收天線接收到帶有語(yǔ)音信號(hào)的回波信號(hào),經(jīng)低噪聲放大器(LNA)放大,然后與VCO產(chǎn)生的34.5 GHz的正弦波信號(hào)進(jìn)行下變頻,而后經(jīng)中頻放大器放大與晶振源產(chǎn)生的1 GHz信號(hào)進(jìn)行混頻,經(jīng)計(jì)算機(jī)處理、D/A和A/D轉(zhuǎn)化得到語(yǔ)音信號(hào)。
超外差體制雷達(dá)系統(tǒng)發(fā)射模塊頻率源不是直接傳送至射頻發(fā)射單元,而是采用超外差方式,通過(guò)上變頻器將34.5 GHz 的高穩(wěn)定性、低噪聲VCO與1 GHz的晶振輸出信號(hào)混頻產(chǎn)生所需的35.5 GHz射頻頻率,并采用功率調(diào)整器將源發(fā)射功率提高到100 mW以上,提升了系統(tǒng)探測(cè)語(yǔ)音信號(hào)的能力。
該雷達(dá)系統(tǒng)工作參數(shù)如表2所示。
表2 超外差雷達(dá)系統(tǒng)工作參數(shù)Tab. 2 Working parameters of the superheterodyne radar system
以上兩種體制雷達(dá)為語(yǔ)音探測(cè)提供了廣闊的研究思路。然而,以上兩代生物雷達(dá)語(yǔ)音探測(cè)技術(shù)存在采集的語(yǔ)音信號(hào)高頻分量不充分,可懂度低等問(wèn)題。因此,本課題組自2013年開(kāi)始,將一種發(fā)射頻率為94 GHz的生物雷達(dá)應(yīng)用于語(yǔ)音信號(hào)探測(cè)[40]。其收發(fā)前端框圖如圖3所示。
圖3 94 GHz雷達(dá)系統(tǒng)收發(fā)前端框圖Fig. 3 Block diagram of transceiver front-end for the 94 GHz radar system
該94 GHz生物雷達(dá)收發(fā)前端系統(tǒng)的主要由介質(zhì)振蕩器、倍頻器、帶通濾波器、鎖頻放大器、平衡混頻器、低噪聲放大器、功率放大器和功分器以及收發(fā)天線組成。系統(tǒng)工作的基本原理如下:由介質(zhì)振蕩器發(fā)射出頻率為7.23 GHz的本振信號(hào),經(jīng)功率放大器和功分器后注入發(fā)射和接收模塊,在發(fā)射模塊,經(jīng)倍頻器(×13)倍頻后得到94 GHz的高頻信號(hào),然后被發(fā)射天線發(fā)出,經(jīng)人體喉部微動(dòng)調(diào)制將信號(hào)反射。在接收模塊,介質(zhì)振蕩器發(fā)射的7.23 GHz本振信號(hào)經(jīng)倍頻器(×12)倍頻后得到86.7 GHz的高頻信號(hào),此高頻信號(hào)與接收天線接收的高頻信號(hào)進(jìn)行混頻得到7.23 GHz的中頻信號(hào)。然后將得到的中頻信號(hào)經(jīng)低噪聲放大器放大后與本振信號(hào)混頻,得到I和Q兩路輸出經(jīng)A/D采集后進(jìn)入電腦,即可獲得語(yǔ)音信號(hào)。
該雷達(dá)系統(tǒng)收發(fā)前端工作參數(shù)如表3所示。
表3 94 GHz生物雷達(dá)系統(tǒng)工作參數(shù)Tab. 3 Working parameters of the 94 GHz radar system
5.2 生物雷達(dá)語(yǔ)音探測(cè)性能對(duì)比分析
為對(duì)比分析上述3種體制生物雷達(dá)語(yǔ)音探測(cè)系統(tǒng)的探測(cè)性能,采用一名男性對(duì)象在安靜的環(huán)境下用耳麥進(jìn)行錄音,錄音語(yǔ)句為“第四軍醫(yī)大學(xué)”,為了保證在相同實(shí)驗(yàn)環(huán)境,相同距離,聲源發(fā)音的一致性,利用體積為15 cm×12 cm×20 cm的音箱播放錄音語(yǔ)句,并在聲源距采集系統(tǒng)2 m和10 m處與麥克風(fēng)同步采集語(yǔ)音信號(hào)。實(shí)驗(yàn)中,聲源需要與采集系統(tǒng)的天線中心保持同等高度,并用激光筆調(diào)整雷達(dá)天線的方向,使其中心對(duì)準(zhǔn)聲源。
圖4是4種語(yǔ)音探測(cè)系統(tǒng)采集的2 m處語(yǔ)音信號(hào)的時(shí)域波形和語(yǔ)譜圖。其中圖4(a),圖4(e)是麥克風(fēng)語(yǔ)音信號(hào),圖4(b),圖4(f)是零差拍雷達(dá)語(yǔ)音信號(hào),圖4(c),圖4(g)是超外差雷達(dá)語(yǔ)音信號(hào),圖4(d),圖4(h)是94 GHz雷達(dá)語(yǔ)音信號(hào)。由圖4可以看出,4種語(yǔ)音探測(cè)技術(shù)都可有效探測(cè)到2 m處的語(yǔ)音信號(hào)。此外,從時(shí)域波形和語(yǔ)譜圖都可以觀察到麥克風(fēng)采集的語(yǔ)音信號(hào)包含大量的噪聲,語(yǔ)音信號(hào)信噪比較低。相比麥克風(fēng)語(yǔ)音信號(hào),雷達(dá)語(yǔ)音信號(hào)所含噪聲較小。由此可以看出,生物雷達(dá)語(yǔ)音探測(cè)技術(shù)相比麥克風(fēng)語(yǔ)音探測(cè)技術(shù)具有較強(qiáng)的抗聲學(xué)噪聲干擾能力。
圖5是4種語(yǔ)音探測(cè)系統(tǒng)采集的10 m處的語(yǔ)音信號(hào)的時(shí)域波形和語(yǔ)譜圖。其中圖5(a),圖5(e)是麥克風(fēng)語(yǔ)音信號(hào),圖5(b),圖5(f)是零差拍雷達(dá)語(yǔ)音信號(hào),圖5(c),圖5(g)是超外差雷達(dá)語(yǔ)音信號(hào),圖5(d),圖5(h)是94 GHz雷達(dá)語(yǔ)音信號(hào)。圖4和圖5對(duì)比發(fā)現(xiàn),隨著探測(cè)距離的增加,4種語(yǔ)音探測(cè)系統(tǒng)都丟失了部分高頻分量,但是仍然可以獲取到語(yǔ)音信號(hào)。同時(shí),還可以看出,94 GHz雷達(dá)所含的噪聲信號(hào)相對(duì)于34 GHz兩種體制生物雷達(dá)明顯較小。這是由于94 GHz雷達(dá)的波束角為1°,而34 GHz生物雷達(dá)的波束角為9°。也就是說(shuō)94 GHz雷達(dá)具有更強(qiáng)的方向性,因此其抗周?chē)晫W(xué)噪聲干擾較強(qiáng)。此外,由于發(fā)射頻率越高,回波信號(hào)的相位變化越大,所探測(cè)的微動(dòng)信號(hào)的靈敏度越高。圖4與圖5的結(jié)果還顯示出超外差語(yǔ)音探測(cè)雷達(dá)所含噪聲較零差拍雷達(dá)較小,這是由于超外差體制雷達(dá)接收器可以減小直流偏置和1/f 噪聲的影響。
圖4 2 m處語(yǔ)音信號(hào)的4種時(shí)域波形和語(yǔ)譜圖Fig. 4 The waveforms and the spectrograms of a speech material (2 m)
圖5 10 m處語(yǔ)音信號(hào)的4種時(shí)域波形和語(yǔ)譜圖Fig. 5 The waveforms and the spectrograms of a speech material (10 m)
綜上所述,生物雷達(dá)語(yǔ)音探測(cè)技術(shù)具有較強(qiáng)的抗聲學(xué)噪聲干擾的能力,能夠非接觸有效地探測(cè)遠(yuǎn)距離語(yǔ)音信號(hào)。
生物雷達(dá)技術(shù)已在災(zāi)害救援、城市反恐以及臨床生命體征監(jiān)測(cè)等場(chǎng)合得到應(yīng)用,而將生物雷達(dá)技術(shù)應(yīng)用于語(yǔ)音探測(cè)領(lǐng)域仍是一項(xiàng)較新的研究。生物雷達(dá)語(yǔ)音探測(cè)技術(shù)為語(yǔ)音信號(hào)的獲取提供了一種新途徑,該探測(cè)技術(shù)在一定程度上彌補(bǔ)了麥克風(fēng)等傳統(tǒng)語(yǔ)音探測(cè)技術(shù)的缺點(diǎn),具有探測(cè)距離遠(yuǎn)、方向性好、抗聲學(xué)噪聲干擾能力強(qiáng)等優(yōu)點(diǎn)。
生物雷達(dá)語(yǔ)音探測(cè)是涉及生物雷達(dá)、人體語(yǔ)音及微弱信號(hào)檢測(cè)等多個(gè)學(xué)科的前沿交叉研究領(lǐng)域。生物雷達(dá)技術(shù)在語(yǔ)音探測(cè)方面的研究主要有2個(gè)方面:一是語(yǔ)音信號(hào)的探測(cè);二是發(fā)音器官振動(dòng)信號(hào)的檢測(cè)。從國(guó)內(nèi)外研究進(jìn)展來(lái)看,目前用生物雷達(dá)進(jìn)行語(yǔ)音信號(hào)探測(cè)及發(fā)音器官振動(dòng)信號(hào)的接觸檢測(cè)方面的研究已取得一定成果。然而,在發(fā)音器官振動(dòng)信號(hào)的非接觸檢測(cè)方面的研究還未見(jiàn)文獻(xiàn)報(bào)道。因此,利用生物雷達(dá)語(yǔ)音探測(cè)技術(shù)進(jìn)一步研究發(fā)音器官振動(dòng)信號(hào)的非接觸檢測(cè)具有重要意義。此外,生物雷達(dá)語(yǔ)音探測(cè)技術(shù)在發(fā)音器官的疾病診斷、嗓音檢測(cè)、語(yǔ)音識(shí)別、語(yǔ)音合成、語(yǔ)音編碼等領(lǐng)域具有重要的應(yīng)用前景。
[1]Wente E C. A condenser transmitter as a uniformly sensitive instrument for the absolute measurement of sound intensity[J]. Physical Review, 1917, 10(1): 39.
[2]Scheeper P R, Van der Donk A G H, Olthuis W, et al.. A review of silicon microphones[J]. Sensors and Actuators A: Physical, 1994, 44(1): 1–11.
[3]Royer M, Holmen J O, Wurm M A, et al.. ZnO on Si integrated acoustic sensor[J]. Sensors and Actuators, 1983, 4: 357–362.
[4]Pedersen M, Olthuis. W, and Bergveld P. A silicon condenser microphone with polyimide diaphragm and backplate[J]. Sensors and Actuators A: Physical, 1997, 63: 97–104.
[5]Kronast W, Müller B, Siedel W, et al.. Single-chip condenser microphone using porous silicon as sacrificial layer for the air gap[J]. Sensors and Actuators A: Physical, 2001, 87(3): 188–193.
[6]Wu C Y, Chen J M, and Kuo C F. Low polarization voltage and high sensitivity CMOS condenser microphone using stress relaxation design[J]. Procedia Chemistry, 2009, 1(1): 859–862.
[7]Shahina A and Yegnanarayana B. Language identification in noisy environments using throat microphone signals[C]. IEEE Proceedings of 2005 International Conference on Intelligent Sensing and Information Processing, 2005: 400–403.
[8]Santori C M. Bone conduction microphone assembly[P]. Washington, DC, US, 1974: 1974-01-22.
[9]Hough J V D, Richard G L, Barton Jr K E, et al.. Direct bone conduction hearing aid device[P]. Washington, DC, US, 1986-09-23.
[10]張杰. 骨傳導(dǎo)聽(tīng)說(shuō)技術(shù)在煤礦應(yīng)急救援的應(yīng)用[J]. 煤炭科學(xué)技術(shù), 2013, 41(8): 95–98. Zhang Jie. Application of bone conduction heared technology in coal mine emergency rescue[J]. Coal Science of Technology, 2013, 41(8): 95–98.
[11]Li W, Liu M, Zhu Z, et al.. LDV remote voice acquisition and enhancement[C]. IEEE 18th International Conference on Pattern Recognition, 2006, 4: 262–265.
[12]Avargel Y and Cohen I. Speech measurements using a laser Doppler vibrometer sensor: Application to speech enhancement[C]. Proceedings of the Hands-Free Speech Communication and Microphone Arrays, Edinburgh, Scotland, 2011: 109–114.
[13]Shang J, He Y, Liu D, et al.. Laser Doppler vibrometer for real-time speech-signal acquirement[J]. Chinese Optics Letters, 2009, 7(8): 732–733.
[14]Bakhtiari S, Gopalsami N, Elmer T W, et al.. Millimeter wave sensor for far-field standoff vibrometry[C]. Proceedings of the 35th Annual Review of Progress in Quantitative Nondestructive Evaluation, Chicago, IL, USA, 2008: 1641–1648.
[15]Li Z W. Millimeter wave radar for detecting the speech signal applications[J]. International Journal of Infrared and Millimeter Waves, 1996, 17(12): 2175–2183.
[16]Sharpe S M, Seals J, MacDonald A H, et al.. Non-contact vital signs monitorp[P]. Washington, DC, U.S., 1990.
[17]Caro C G and Bloice J A. Contactless apnoea detector based on radar[J]. The Lancet, 1971, 298(7731): 959–961.
[18]Chen K M, Huang Y, Zhang J, et al.. Microwave lifedetection systems for searching human subjects under earthquake rubble or behind barrier[J]. IEEE Transactions on Biomedical Engineering, 2000, 47(1): 105–114.
[19]Lohman B, Boric-Lubecke O, Lubecke V M, et al.. A digital signal processor for Doppler radar sensing of vital signs[J]. IEEE Engineering in Medicine and Biology Magazine, 2002,21(5): 161–164.
[20]王健琪, 王海濱, 荊西京, 等. 呼吸, 心率的雷達(dá)式非接觸檢測(cè)系統(tǒng)設(shè)計(jì)與研究[J]. 中國(guó)醫(yī)療器械雜志, 2001, 25(3): 132–135. Wang Jian-qi, Wang Hai-bin, Jing Xi-jing, et al.. The study on non-contact detection of breathing and heartbeat based on radar principles[J]. Chinese Journal of Medical Instrumentation, 2001, 25(3): 132–135.
[21]Wang Jianqi, Zheng Chongxun, Lu Guohua, et al.. A new method for identifying the life parameters via radar[J]. EURASIP Journal on Applied Signal Processing, 2007, 2007: 031415.
[22]McEwan T E. Ultra-wideband receiver[P]. Washington, DC: U.S., 1996-06-04.
[23]Holzrichter J F, Lea W A, McEwan T E, et al.. Speech coding, recognition, and synthesis using radar and acoustic sensors[R]. University of California Report UCRL-ID-123687, 1996.
[24]Holzrichter J F, Burnett G C, Ng L C, et al.. Speech articulator measurements using low power EM-wave sensors[J]. The Journal of the Acoustical Society of America, 1998, 103(1): 622–625.
[25]Burnett G C, Holzrichter J F, Ng L C, et al.. The use of Glottal Electromagnetic Micropower Sensors (GEMS) in determining a voiced excitation function[J]. The Journal of the Acoustical Society of America, 1999, 106(4): 2183–2184.
[26]Ng L C, Burnett G C, Holzrichter J F, et al.. Denoising of human speech using combined acoustic and EM sensor signal processing[C]. IEEE International Conference on Acoustics, Speech, and Signal Processing, ICASSP’00, 2000, 1: 229–232.
[27]Titze I R, Story B H, Burnett G C, et al.. Comparison between electroglottography and electromagnetic glottography[J]. The Journal of the Acoustical Society of America, 2000, 107(1): 581–588.
[28]Staderini E M. UWB radars in medicine[J]. IEEE Aerospace and Electronic Systems Magazine, 2002, 17(1): 13–18.
[29]Holzrichter J F, Ng L C, Burke G J, et al.. Measurements of glottal structure dynamics[J]. The Journal of the Acoustical Society of America, 2005, 117(3): 1373–1385.
[30]Eid A M and Wallace J W. Ultrawideband speech sensing[J]. IEEE Antennas and Wireless Propagation Letters, 2009, 8: 1414–1417.
[31]Lin C S, Chang S F, Chang C C, et al.. Microwave human vocal vibration signal detection based on doppler radar technology[J]. IEEE Transactions on Microwave Theory and Techniques, 2010, 58(8): 2299–2306.
[32]Hu R and Anderson D V. Single acoustic-channel speech enhancement based on glottal correlation using non-acoustic sensor[C]. INTERSPEECH, 2004.
[33]Hu R and Raj B. A robust voice activity detector using an acoustic Doppler radar[C]. IEEE Workshop on Automatic Speech Recognition and Understanding, 2005: 319–324.
[34]Quatieri T F, Brady K, Messing D, et al.. Exploiting nonacoustic sensors for speech encoding[J]. IEEE Transactions on Audio, Speech, and Language Processing, 2006, 14(2): 533–544.
[35]Demiroglu C, Kamath S D, and Anderson D V. Segmentation-Based Speech Enhancement for Intelligibility Improvement in MELP Coders Using Auxiliary Sensors[C]. ICASSP (1), 2005: 797–800.
[36]Xiao Y, Lin J, Boric-Lubecke O, et al.. A Ka-band low power Doppler radar system for remote detection of cardiopulmonary motion[C]. IEEE Engineering in Medicine and Biology 27th Annual Conference, 2006: 7151–7154.
[37]劉誠(chéng)睿, 王健琪, 荊西京, 等. 非接觸式語(yǔ)音探測(cè)系統(tǒng)[J]. 醫(yī)療衛(wèi)生裝備, 2006, 27(6): 28–29. Liu Cheng-rui, Wang Jian-qi, Jing Xi-jing, et al.. Noncontact speech detection system[J]. Chinese Medical Equipment Journal, 2006, 27(6): 28–29.
[38]Li S, Wang J Q, Niu M, et al.. Millimeter wave conduct speech enhancement based on auditory masking properties[J]. Microwave and Optical Technology Letters, 2008, 50(8): 2109–2114.
[39]Bakhtiari S, Elmer T W, Cox N M, et al.. Compact millimeter-wave sensor for remote monitoring of vital signs[J]. IEEE Transactions on Instrumentation and Measurement, 2012, 61(3): 830–841.
[40]Li S, Tian Y, Lu G, et al.. A 94-GHz millimeter-wave sensor for speech signal acquisition[J]. Sensors, 2013, 13(11): 14248–14260.
[41]蔣金, 陳長(zhǎng)興, 周天翔, 等. 毫米波大氣窗口在臨近空間等離子體鞘套中的傳播特性[J]. 空間科學(xué)學(xué)報(bào), 2016, 36(1): 56–62. Jiang Jin, Chen Chang-xing, Zhou Tian-xiang, et al.. Study on atmospheric window of millimeter wave propagation in near space plasma sheath[J]. Chinese Journal of Space Science, 2016, 36(1): 56–62.
Advancements in Bio-radar Speech Signal Detection Technology
Chen Fuming①Li Sheng②An Qiang①Zhang Ziqi①Wang Jianqi①
①(School of Biomedical Engineering, Fourth Military Medical University, Xi’an 710032)
②(College of Control Engineering, Xijing University, Xi’an 710123)
Speech signal acquisition is of great significance for human communication. Bio-radar technology has many advantages, such as it is noncontact, noninvasive, safe, highly directional, highly sensitivity, immune to strong acoustical disturbance and penetrable. This technology has important applications in the field of speech detection. In this paper, we first review the developmental history of speech detection technology, and then summarize the status of bio-radar speech detection technology. The basic principles of a bio-radar in detecting speech signals are given, and the performance of three types of bio-radar speech detection systems are compared in this paper. Finally, the potential applications of bio-radar speech signal detection technology are prospected. Key words: Bio-radar; Speech detection; Speech signal; Acoustic sensor
TN957.51
A
2095-283X(2016)05-0477-10
10.12000/JR16099
陳扶明, 李盛, 安強(qiáng), 等. 生物雷達(dá)語(yǔ)音信號(hào)探測(cè)技術(shù)研究進(jìn)展[J]. 雷達(dá)學(xué)報(bào), 2016, 5(5): 477–486.
10.12000/JR16099.
Reference format: Chen Fuming, Li Sheng, An Qiang, et al.. Advancements in bio-radar speech signal detection technology[J]. Journal of Radars, 2016, 5(5): 477–486. DOI: 10.12000/JR16099.
2016-09-13;改回日期:2016-11-02;
2016-11-16
*通信作者:王健琪 wangjq@fmmu.edu.cn
國(guó)家自然科學(xué)基金(61327805, 61371163),陜西省工業(yè)科技攻關(guān)(2016GY-058)
陳扶明(1989–),男,甘肅人,第四軍醫(yī)大學(xué)生物醫(yī)學(xué)工程學(xué)院博士研究生,研究方向?yàn)樯锢走_(dá)語(yǔ)音信號(hào)探測(cè)、生物雷達(dá)生理信號(hào)檢測(cè)。
E-mail: cfm5762@126.com
李 盛(1972–),男,副教授,博士,碩士生導(dǎo)師,研究方向?yàn)樯畔⒌墨@取及處理。
E-mail: sheng@mail.xjtu.edu.cn
安 強(qiáng)(1990–),男,甘肅天水人,第四軍醫(yī)大學(xué)生物醫(yī)學(xué)工程學(xué)院博士生,研究方向?yàn)榉墙佑|生理信號(hào)檢測(cè)和穿墻成像等。
Foundation Items: The National Natural Science Foundation of China (61327805, 61371163), The Key Industrial Science and Technology Program of Shaanxi Province, China (2016GY-058)