李聲飛
摘 ?要: 為了解決直升機(jī)平臺強(qiáng)旋翼噪聲對飛行員通話干擾問題,設(shè)計(jì)一種基于Xilinx ZYNQ??7000平臺的話音處理系統(tǒng)。該系統(tǒng)由模擬音頻處理單元和數(shù)字音頻處理單元組成,模擬音頻單元完成飛行員模擬話音信號的匹配、濾波、預(yù)處理和A/D變換,數(shù)字音頻處理單元利用ZYNQ平臺強(qiáng)大的綜合處理能力,完成數(shù)字話音信號的協(xié)議解析和混音控制,并針對直升機(jī)艙內(nèi)噪音的特點(diǎn),設(shè)計(jì)一套適用于直升機(jī)強(qiáng)噪聲平臺的話音處理算法。最后通過外場飛行試驗(yàn)表明,該系統(tǒng)能夠有效抑制直升機(jī)駕駛艙內(nèi)通話噪聲,增強(qiáng)語音信號,提高飛行員通話的可聽可懂度和舒適度。
關(guān)鍵詞: 直升機(jī); 強(qiáng)旋翼噪聲; 話音處理系統(tǒng); 數(shù)字話音信號; ZYNQ平臺; 噪聲抑制
中圖分類號: TN914?34 ? ? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識碼: A ? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2019)10?0124?04
Research and implementation of a voice processing system suitable for
strong rotor noise environment of helicopter
LI Shengfei
(The Tenth Research Institute of China Electronic Technology Group Corporation, Chengdu 610000, China)
Abstract: A voice processing system based on the Xilinx ZYNQ??7000 platform is designed to solve the interference problem of the helicopter platform′s strong rotor noises to pilots′ voices. The system is composed of the analog audio processing unit and digital audio processing unit. The analog audio processing unit is used to complete the matching, filtering, preprocessing and AD transformation of analog voice signals of the pilot. The digital audio processing unit is used to complete the protocol analysis and mixed voice control of the digital voice signals in virtue of the strong and comprehensive processing ability of the ZYNQ platform. In allusion to the characteristics of the cabin noises in helicopter, an audio processing algorithm suitable for the strong noise platform of the helicopter is designed. The results of the outfield flight test show that the system can effectively suppress the voice noises in the cockpit of helicopter, enhance voice signals, and improve the intelligibility and comfortability of pilots′ voices.
Keywords: helicopter; strong rotor noise; voice processing system; digital voice signal; ZYNQ platform; noise suppression
0 ?引 ?言
直升機(jī)具有獨(dú)特的飛行能力,在現(xiàn)代軍事、反恐演習(xí)和國民經(jīng)濟(jì)等場合起到了不可替代的作用。由于直升機(jī)特殊的構(gòu)造,在飛行時(shí)旋翼尾槳高速旋轉(zhuǎn),槳平面對周圍空氣形成周期性的壓力而產(chǎn)生巨大的機(jī)械噪聲[1]。如果不進(jìn)行降噪處理,這些環(huán)境噪聲將通過駕駛艙內(nèi)的飛行員話筒進(jìn)入機(jī)載音頻設(shè)備,對飛行員的正常通話產(chǎn)生巨大干擾,嚴(yán)重時(shí)噪聲會(huì)完全淹沒正常的話音信號,從而威脅到飛行安全和指揮控制[2],因此研究降噪技術(shù)對直升機(jī)的飛行安全有至關(guān)重要的作用。針對直升機(jī)平臺的特殊應(yīng)用場景,提出一種抗強(qiáng)干擾的數(shù)字話音處理系統(tǒng)。該系統(tǒng)運(yùn)用數(shù)字音頻處理技術(shù),對飛行員帶噪話音信號進(jìn)行濾波、放大和預(yù)處理,將模擬話音信號轉(zhuǎn)換為數(shù)字信號;后端通過數(shù)字音頻處理算法對帶噪數(shù)字信號進(jìn)行噪聲抑制、語音增強(qiáng)等處理,有效地抑制環(huán)境噪聲,提高了飛行員通話的可聽可懂度[3],減小了話音延遲。
1 ?原理描述
為了更有效地抑制直升機(jī)艙內(nèi)噪聲,首先應(yīng)對駕駛艙內(nèi)噪聲源進(jìn)行分析。噪聲來源如圖1所示。
圖1 ?直升機(jī)艙內(nèi)噪聲來源
從圖1可看出,直升機(jī)艙內(nèi)噪聲主要來源于旋翼噪聲、尾槳噪聲、齒輪箱機(jī)械噪聲和發(fā)動(dòng)機(jī)壓縮噪聲等[4]。進(jìn)一步對直升機(jī)噪聲進(jìn)行量化分析,在外場直升機(jī)飛行噪聲試驗(yàn)過程中實(shí)錄了一段直升機(jī)艙內(nèi)環(huán)境噪聲,對其進(jìn)行功率譜分析如圖2所示。
圖2 ?直升機(jī)噪聲功率譜
從圖2可知,直升機(jī)噪聲能量主要集中在0~500 Hz頻段內(nèi)的旋翼尾槳噪聲,在0~500 Hz內(nèi)的噪聲能量分布不均勻,可看出在低頻段(0~150 Hz)內(nèi)噪聲能量較大,高頻段(150~500 Hz)噪聲能量相對較小,且由于直升機(jī)旋翼周期旋轉(zhuǎn)使得噪聲在某些頻點(diǎn)上特別突出,實(shí)測的噪聲分析結(jié)果與理論分析一致。
針對直升機(jī)噪聲頻段低、信噪比小等特點(diǎn),傳統(tǒng)的話音檢測算法不能準(zhǔn)確地分辨出話音信號,提出一種基于短時(shí)能量和過零率相結(jié)合的方法,能夠有效提高話音判定的準(zhǔn)確率。檢測算法原理是,噪聲與語音歸一化自相關(guān)函數(shù)中極大值(即能量)的概率分布不同,利用這種能量分布不同的特點(diǎn),可對濁音及非濁音(包括清音和噪聲)進(jìn)行判定[5]。話音信號具有短時(shí)平穩(wěn)性,通常認(rèn)為10~30 ms的時(shí)間范圍內(nèi)話音信號是準(zhǔn)穩(wěn)態(tài)過程,利用短時(shí)能量對話音信號進(jìn)行激活檢測,假定第w幀話音信號[Sw(n)]的短時(shí)能量為[Ew]。短時(shí)能量的計(jì)算式公式為:
[Ew=n=1NS2w(n)] ? ? ? (1)
設(shè)定閾值Y,當(dāng)計(jì)算的短時(shí)能量[Ew
[ZCR=12i=0N-1sgnx(i)-sgnx(i-1)] ? (2)
式中,sgn[·] 表示符號函數(shù),即
[sgn[x]=1,x≥0-1,x<0] (3)
通過統(tǒng)計(jì)分析,噪聲的過零率比信號的過零率大,當(dāng)[ZCR]小于設(shè)定閾值Z時(shí),認(rèn)為是話音信號,大于閾值時(shí)判定為噪聲。
利用直升機(jī)環(huán)境噪聲具有短時(shí)平穩(wěn)性的特點(diǎn),采用譜減法作為直升機(jī)平臺自適應(yīng)噪聲抑制方法。譜減法原理[7]是,話音信號的短時(shí)幅度比短時(shí)相位更容易對人的聽覺系統(tǒng)產(chǎn)生影響,用無話音時(shí)的噪聲頻譜代替有話音時(shí)的噪聲頻譜,再與含噪聲的話音頻譜相減,可得到話音信號的頻譜估計(jì)值,從而達(dá)到消除噪聲的目的。假設(shè)帶噪話音信號模型為:
[y(t)=s(t)+n(t)] (4)
式中:[y(t)]是帶噪話音;[s(t)]是純凈話音;[n(t)]是噪聲信號。對式(4)進(jìn)行傅里葉變換,得:
[Y(k)=S(k)+N(k)] (5)
忽略純凈話音和噪聲之間的相位差異,即話音和噪聲是獨(dú)立不相關(guān)的,可以近似推算出:
[Y(k)2=S(k)2+N(k)2] (6)
利用人耳對話音相位不敏感特征,在式(6)中從帶噪話音幅度譜中減去噪聲的幅度譜,就得到了原始話音的幅度譜:
[S(k)=Y(k)2-EN(k)212] (7)
式中:[EN(k)2]為無語音時(shí)噪聲譜的統(tǒng)計(jì)平均值;[Y(k)]為帶噪話音譜;[N(k)]為噪聲譜。
2 ?系統(tǒng)架構(gòu)
數(shù)字話音處理系統(tǒng)原理框圖如圖3所示。
該系統(tǒng)包括模擬音頻處理、數(shù)字音頻處理兩部分。其中模擬音頻部分完成輸入模擬音頻信號的采集和放大,模擬音頻信號經(jīng)A/D轉(zhuǎn)換,把轉(zhuǎn)換后的數(shù)字信號送入數(shù)字音頻處理部分。為了消除回聲干擾抑制嘯叫,首先將數(shù)字音頻信號與自適應(yīng)回聲抵消模塊輸出的信號進(jìn)行混音,混音后的信號送話音端點(diǎn)檢測模塊,進(jìn)行有無話音判決。當(dāng)發(fā)現(xiàn)有話音時(shí),分別將話音信號送入自適應(yīng)噪聲抑制模塊、自動(dòng)增益控制模塊進(jìn)行噪聲抑制和話音增強(qiáng)等處理。當(dāng)發(fā)現(xiàn)無噪聲時(shí),送入舒適背景噪聲產(chǎn)生模塊生成白噪聲,輸出端對白噪聲和處理后的話音信號進(jìn)行混音、加權(quán)等處理。處理后的數(shù)字話音信號經(jīng)過輸出音頻接口模塊進(jìn)行D/A轉(zhuǎn)換、放大等處理,驅(qū)動(dòng)耳機(jī)、擴(kuò)聲器等音頻設(shè)備。
3 ?硬件電路設(shè)計(jì)
數(shù)字話音處理系統(tǒng)硬件框圖如圖4所示。其中模擬音頻接口包括輸入音頻匹配單元、A/D?D/A轉(zhuǎn)換單元和輸出音頻接口單元,完成輸入模擬信號的阻抗匹配、A/D轉(zhuǎn)換、濾波,將模擬音頻信號轉(zhuǎn)換為數(shù)字信號;同時(shí)將處理完后的數(shù)字信號進(jìn)行D/A轉(zhuǎn)換、輸出放大和匹配,驅(qū)動(dòng)耳機(jī)等音頻設(shè)備。
圖4 ?數(shù)字話音處理系統(tǒng)硬件框圖
數(shù)字音頻處理部分采用ZYNQ?7000架構(gòu),實(shí)現(xiàn)數(shù)字信號算法處理、A/D接口轉(zhuǎn)換、數(shù)據(jù)儲存等數(shù)字電路功能。其中,供電單元完成模塊所需電壓的生成;時(shí)鐘單元為模塊提供時(shí)鐘驅(qū)動(dòng);ZYNQ單元的ARM處理器完成數(shù)字音頻處理算法的嵌入式實(shí)現(xiàn);DDR存儲器部分作為ARM的數(shù)據(jù)緩存區(qū);FLASH部分用于儲存ARM程序、告警音頻數(shù)據(jù)及其余控制信息;ZYNQ單元的FPGA部分為模塊提供可擴(kuò)展性,主要完成話音通道控制、A/D控制、協(xié)議轉(zhuǎn)換、數(shù)據(jù)緩存、外圍控制信號生成、模塊時(shí)鐘分發(fā)等功能;FPGA外部擴(kuò)展一塊BPI FLASH,用作固化代碼的存儲和加載。
4 ?軟件處理流程
數(shù)字話音處理系統(tǒng)流程包括模擬話音處理流程和數(shù)字話音處理流程。模擬話音處理流程如圖5a)所示。對模擬話音信號進(jìn)行信號匹配、A/D采樣,將模擬話音轉(zhuǎn)換為數(shù)字話音,送入數(shù)字話音處理系統(tǒng)進(jìn)行數(shù)字化處理。對經(jīng)過數(shù)字系統(tǒng)處理后的話音信號進(jìn)行增益控制、D/A變換、混音輸出和匹配切換,將模擬音頻信號調(diào)節(jié)到合適的強(qiáng)度后驅(qū)動(dòng)話筒耳機(jī)等音響設(shè)備。
數(shù)字話音處理流程如圖5b)所示。首先在DSP運(yùn)行上電初始化程序,對A/D芯片、FLASH存儲器和DDR控制器等硬件資源進(jìn)行配置,同時(shí)啟動(dòng)中斷函數(shù)監(jiān)聽是否收到FPGA緩存中斷;當(dāng)檢測到有緩存中斷時(shí)調(diào)用中斷服務(wù)函數(shù),中斷函數(shù)每次讀取FIFO內(nèi)8 ms時(shí)長的話音數(shù)據(jù);同時(shí)為了滿足話音信號準(zhǔn)平穩(wěn)特征,需要將本次8 ms時(shí)長數(shù)據(jù)和前2次(共計(jì)16 ms)數(shù)據(jù)組幀,構(gòu)造出24 ms的短時(shí)平穩(wěn)話音數(shù)據(jù),選擇漢明窗對該數(shù)據(jù)進(jìn)行加窗操作,可將連續(xù)的話音信號變換成分段話音信號便于后端處理。加窗后的信號送到話音有無檢測模塊進(jìn)行判決,當(dāng)檢測到無話音時(shí)送入舒適噪聲產(chǎn)生模塊,重構(gòu)背景噪聲后輸出;當(dāng)檢測到有噪聲時(shí)依次送入自適應(yīng)噪聲抑制和自動(dòng)增益控制模塊,進(jìn)行降噪和增強(qiáng)處理,從而壓縮信號的動(dòng)態(tài)范圍和平滑背景噪聲。把經(jīng)上述流程處理后的音頻信號送入音頻輸出模塊。
圖5 ?話音處理軟件流程圖
5 ?試驗(yàn)驗(yàn)證
搭建圖6所示的話音處理系統(tǒng)驗(yàn)證環(huán)境[8],驗(yàn)證數(shù)字話音系統(tǒng)的性能。
圖6 ?系統(tǒng)環(huán)境試驗(yàn)圖
在外場直升機(jī)飛行噪聲試驗(yàn)中實(shí)錄一段信噪比為5 dB的話音信號作為測試激勵(lì)[9]信號,該信號是直升機(jī)旋翼噪聲和機(jī)載無線電設(shè)備疊加的帶噪話音段,代表著一種典型 [10]的直升機(jī)座艙話音信號。將該激勵(lì)信號輸入到話音處理系統(tǒng)進(jìn)行處理,并對處理前后波形對比分析,如圖7所示。
圖7 ?數(shù)字話音處理降噪效果對比圖
圖7a)為輸入信噪比為5 dB的帶噪話音段,圖7b)為處理后音頻信號。通過對比可看出,輸入的話音信號帶有強(qiáng)噪聲,經(jīng)過數(shù)字話音系統(tǒng)處理后,該話音信號的有音/無音段被準(zhǔn)確地分辨出來,無音段信號的噪聲被有效抑制,有音段的話音信號被合理增強(qiáng);同時(shí)該系統(tǒng)能精確地控制增益衰減,達(dá)到了壓縮信號的動(dòng)態(tài)范圍和平滑背景噪聲的目的。
6 ?結(jié) ?論
本文設(shè)計(jì)一種基于Xilinx公司ZYNQ??7000架構(gòu)的數(shù)字話音處理系統(tǒng)。系統(tǒng)核心軟件駐留在ZYNQ?7000處理器中,在PL邏輯處理單元完成A/D控制、協(xié)議解析和數(shù)據(jù)緩沖,在PS內(nèi)嵌雙核ARM? CortexTM?A9處理器,完成音頻處理算法的嵌入式實(shí)現(xiàn)。通過搭建仿真平臺驗(yàn)證系統(tǒng)功能,該系統(tǒng)能夠有效抑制直升機(jī)飛行時(shí)旋翼、尾槳等環(huán)境噪聲,提高了飛行員通話的可聽可懂度和舒適度,且具有小型化、通用化等優(yōu)點(diǎn),可推廣應(yīng)用于航空、船舶[11]等領(lǐng)域。
參考文獻(xiàn)
[1] 徐國華,史勇杰,招啟軍,等.直升機(jī)旋翼氣動(dòng)噪聲的研究新進(jìn)展[J].航空學(xué)報(bào),2017,38(7):23?38.
XU Guohua, SHI Yongjie, ZHAO Qijun, et al. New developments in researches on helicopter rotor aerodynamic noise [J]. Acta aeronautica et astronautica sinica, 2017, 38(7): 23?38.
[2] 王春輝,王華明,歐飛.螺旋槳飛機(jī)艙內(nèi)噪聲特性分析[J].大眾科技,2014,16(11):90?92.
WANG Chunhui, WANG Huaming, OU Fei. Analysis on the cabin noise of propeller plane [J]. Popular science & technology, 2014, 16(11): 90?92.
[3] 陳亞繁,許勇,楊軍.單通道語音增強(qiáng)對低信噪比漢語可懂度的影響[J].電聲技術(shù),2016,40(10):49?52.
CHEN Yafan, XU Yong, YANG Jun. Comparative study about effect of single?channel speech enhancement algorithms on Chinese intelligibility at low signal?to?noise ratios [J]. Audio engineering, 2016, 40(10): 49?52.
[4] 劉國強(qiáng),董明明,秦浩.直升機(jī)振動(dòng)和噪聲聯(lián)合環(huán)境對人體的影響[J].航空科學(xué)技術(shù),2016,27(11):30?33.
LIU Guoqiang, DONG Mingming, QIN Hao. The effects of helicopter noise and vibration joint environment on the human body [J]. Aeronautical science and technology, 2016, 27(11): 30?33.
[5] 董胡.倒譜距離和短時(shí)能量的語音端點(diǎn)檢測方法研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2014,24(7):77?79.
DONG Hu. Study on speech endpoint detection based on cepstrum distance and short?time energy[J]. Computer technology and development, 2014, 24(7): 77?79.
[6] 紀(jì)振發(fā),楊暉,李然,等.基于短時(shí)自相關(guān)及過零率的語音端點(diǎn)檢測算法[J].電子科技,2016,29(9):52?55.
JI Zhenfa, YANG Hui, LI Ran, et al. Speech endpoint detection algorithm based on short time autocorrelation and short?time zero crossing rate [J]. Electronic science and technology, 2016, 29(9): 52?55.
[7] UPADHYAY N, KARMAKAR A. An improved multi?band spectral subtraction algorithm for enhancing speech in various noise environments [J]. Procedia engineering, 2013, 64: 312?321.
[8] 章圣焰,崔明明.一種機(jī)載語音信號捕獲方法設(shè)計(jì)與實(shí)現(xiàn)[J].航空電子技術(shù),2017,48(1):52?56.
ZHANG Shengyan, CUI Mingming. A design and implementation method for airborne audio signal capture [J]. Avionics technology, 2017, 48(1): 52?56.
[9] RIBEIRO F, FLOR?NCIO D, ZHANG C, et al. CROWDMOS: an approach for crowdsourcing mean opinion score studies [C]// Proceedings of IEEE International Conference on Acoustics, Speech and Signal Processing. Prague: IEEE, 2011: 2416?2419.
[10] SLAVATA O, HOLUB J. Evaluation of objective speech transmission quality measurements in packet?based networks [J]. Computer standards & interfaces, 2014, 36(3): 626?630.
[11] YANG G, SHIPYARD Q Q. Prediction of cabin noise based on grey system theory and reduction technology research [J]. Ship engineering, 2014(S1): 249?251.