吳燕藝,李劍汶,童 峰
(廈門大學 海洋與地球學院,水聲通信與海洋信息技術教育部重點實驗室,福建廈門361102)
?
采用時間反轉的調(diào)頻水聲語音通信方法
吳燕藝,李劍汶,童峰*
(廈門大學 海洋與地球學院,水聲通信與海洋信息技術教育部重點實驗室,福建廈門361102)
摘要:調(diào)頻語音通信技術具有抗干擾性能好、易于實現(xiàn)的特點,但在水聲信道多徑條件下調(diào)頻體制傳輸?shù)乃曊Z音質(zhì)量受到嚴重影響.針對此問題在調(diào)頻語音通信體制下引入時間反轉處理,通過抑制多徑效應聚焦能量提高信號信噪比,改善調(diào)頻水聲語音通信性能,并采用客觀語音質(zhì)量評估 (perceptual evaluation of speech quality,PESQ)方法對調(diào)頻水聲語音通信質(zhì)量進行評估.海洋試驗證明,時間反轉處理可有效提高調(diào)頻水聲語音通信系統(tǒng)性能.
關鍵詞:水聲語音通信;調(diào)頻;時間反轉;多徑信道
水聲語音通信在海洋工程、軍事訓練、海洋開發(fā)、搜救、水下觀光、潛水作業(yè)等場合有著廣泛的應用.單邊帶水聲語音通信是最早的水聲語音通信手段,如美國海軍水聲實驗室研制的水下電話[1].但在復雜時空變化特性、強多徑、強噪聲等惡劣水聲信道條件下,單邊帶調(diào)制性能受到了嚴重的限制.針對單邊帶技術的缺點,數(shù)字體制水聲語音通信技術得到廣泛研究.法國碼激勵線性預測實驗系統(tǒng),采用四進制差分相移鍵控(4-differential phase shift keying,4-DPSK)調(diào)制和最小均方算法 (判決反饋均衡器)[2].陳冰等[3]采用正交頻分復用技術(orthogonal frequency division multiplexing,OFDM)設計出適用于水聲信道環(huán)境的實時語音通信系統(tǒng).殷敬偉等[4]設計并實現(xiàn)一套時域差分OFDM水下語音通信系統(tǒng),并與常規(guī)OFDM方法相比較,體現(xiàn)了差分OFDM具有的優(yōu)點.曾堃等[5]基于時頻差分OFDM設計了水聲語音通信系統(tǒng).但是,OFDM、正交相移鍵控(quadrature phase shift keying,QPSK)等數(shù)字調(diào)制技術雖具有高頻譜利用率、強抗干擾能力等優(yōu)點,但OFDM對多普勒頻移和相位噪聲敏感,子載波的正交性容易被破壞,QPSK需要嚴格的載波同步,容易受碼間干擾影響,造成通信性能下降.同時,數(shù)字通信體制的語音通信都需配合聲碼器或語音識別器,增加了系統(tǒng)的復雜度,且在高誤碼情況下會導致語音完全損失.
調(diào)頻水聲語音通信技術具有良好的通信效果,如調(diào)制效率高、抗噪性能好等特點[6],特別是在較低信噪比條件下可充分利用人耳的噪聲抑制能力提高語音通信效果.黃紹[7]設計了一套調(diào)頻水聲語音通信系統(tǒng).但在多徑條件下,調(diào)頻體制對于多徑效應的抵抗能力較弱,嚴重影響通信性能.在傳統(tǒng)模擬調(diào)頻調(diào)制解調(diào)過程中會產(chǎn)生噪聲干擾,一定程度影響水聲語音通信.本研究考慮多徑信道下的水聲語音通信需求,在傳統(tǒng)調(diào)頻語音通信體制內(nèi)引入時間反轉技術以改善系統(tǒng)性能.
時間反轉技術可有效抑制多徑效應,通過聚焦多徑提升水聲語音通信系統(tǒng)性能.目前在數(shù)字體制通信系統(tǒng)中,為了對抗信道中的多徑效應,時間反轉技術在QPSK、OFDM等數(shù)字水聲通信體制中得到廣泛研究和應用[8-9],但在調(diào)頻體制中的應用尚不多見.
本研究在調(diào)頻水聲通信中引入時間反轉處理,對調(diào)頻解調(diào)后的語音信號進行時間反轉處理,即在語音頻帶內(nèi)進行時間反轉處理,保留了模擬調(diào)頻解調(diào)體制實現(xiàn)簡單特點的同時,利用時間反轉處理改善語音質(zhì)量.
水聲語音通信的性能評估,主要通過計算語音信噪比,從能量方面進行評估,計算方便,但未考慮語音聽感、可懂度等.語音質(zhì)量包括兩個方面內(nèi)容:清晰度和自然度.語音質(zhì)量評估是一個極其復雜的問題,從評價的主體上講可分為兩大類:主觀評價和客觀評價.目前,國內(nèi)外使用較多的主觀評價方法有:平均意見分(mean opinion score,MOS)、音韻字可懂度測量(diagnostic rhyme test,DRT)和滿意度測量(diagnostic acceptability measure,DAM)[10].主觀評價主要靠人對語音質(zhì)量的感覺,但是費時費力費錢,而且靈活度不夠,受人的主觀影響較大.
為了克服信噪比評估和語音主觀評價的缺點,本研究采用客觀評價方法進行質(zhì)量評估.客觀語音質(zhì)量評估(perceptual evaluation of speech quality,PESQ)方法[11]是國際電信同盟(International Telecommunications Union,ITU)于2001年采用感知語音質(zhì)量測量(perceptual speech quality measure,PSQM)的感知模型和感知分析測試系統(tǒng)(perceptual analysis measurement system,PAMS)的延時校準方法形成的,PESQ算法采用改進型認知模型技術和聽覺模型技術,充分考慮端到端的網(wǎng)絡時延,因此對通信時延、環(huán)境噪聲等有較好的魯棒性[12],可以用于測評不同類型的網(wǎng)絡,已成為了ITU的語音評價標準.為了量化體現(xiàn)信號質(zhì)量的改善程度,本研究采用PESQ客觀語音質(zhì)量評估算法對時間反轉處理前后的海試解調(diào)語音進行質(zhì)量評估.
1調(diào)頻水聲語音通信原理
頻率調(diào)制[13]可以用式(1)表達:
eθ(t)=A0cos[ω0t+φ(t)+φ0],
(1)
其中,A0為載波振幅,φ0是調(diào)角波的初始相角,φ(t)+φ0是調(diào)角波的順時相角.對于調(diào)頻波[13],則:
(2)
其中,g(τ)是調(diào)制信號,Kf是調(diào)制靈敏度(rad/(s·V)).將式(2)代入式(1),假設起始相位角為0,則調(diào)頻信號的表達式[13]為:
(3)
若g(t)=A1cos(Ωt),并將g(t)代入式(1)和式(3)即得:
A0cos[ω0t+mfsin(Ωt)],
(4)
其中mf為調(diào)頻指數(shù),
(5)
由式(5)可得,對于單音調(diào)頻波調(diào)制指數(shù)mf反比于調(diào)制角頻率Ω.
在調(diào)頻調(diào)制過程中,調(diào)頻信號由于非線性調(diào)制造成了其頻譜結構中具有新的邊頻成分且在有效調(diào)制帶寬兩側成對稱分布.這一特性使得調(diào)頻信號具有較強的抗干擾能力,可以抵抗信道中的干擾[6].在接收端,解調(diào)過程中限幅器的應用使得調(diào)頻體制對調(diào)頻信號在信道傳播過程中產(chǎn)生的畸變具有一定的抑制.本文采用非線性解調(diào)電路,由于非線性電路的特點[14]使得調(diào)頻信號的解調(diào)過程的頻率捕獲效應更加明顯,這一特點可以加強調(diào)頻體制系統(tǒng)的抗多徑性能.
2時間反轉技術
時間反轉處理[15]可簡單描述如下:
設水聲信道的沖激響應為h(t),發(fā)射的水聲語音信號包含語音信息s(t)和探針信號p(t),s(t)和p(t)經(jīng)過信道后可得:
sr=s(t)?h(t)+ns(t),
pr(t)=p(t)?h(t)+np(t).
其中ns(t)、np(t)為信道中的噪聲干擾.提取接收到的探針信號pr(t),經(jīng)過時間反轉處理得到pr(-t),pr(-t)將被存放在時間反轉存儲器中,該過程稱為預處理過程.將接收信號sr(t)與時間反轉后的探針信號pr(-t)作卷積可得預處理器輸出信號:
r(t)=s(t)?h(t)?p(-t)?h(-t)+n(t).
其中n(t)即為預處理器輸出的干擾噪聲.為了還原原始信號s(t),探針信號p(t)必須具有良好的自相關性,使得p(t)?p(-t)也近似于δ(t),最終可以得到時間反轉處理后的信號:
目前,時間反轉已經(jīng)在數(shù)字通信體制如QPSK和OFDM中得到廣泛的研究和應用[16],但在調(diào)頻體制中的應用尚不多見,本研究在調(diào)頻體制中引入時間反轉技術對抗水聲信道中的多徑效應,提升系統(tǒng)性能.
3調(diào)頻水聲語音通信方案
調(diào)頻體制雖然已被運用在水聲語音通信之中,但由于其對于水聲信道中的多徑效應抵抗較差,同時在調(diào)頻調(diào)制解調(diào)過程中會產(chǎn)生邊頻分量,一定程度上增加了系統(tǒng)噪聲對語音解調(diào)質(zhì)量的影響.這都是在水聲語音通信中需要解決的問題.本文中針對調(diào)頻體制的缺點,提出利用時間反轉技術應對上述問題以改善系統(tǒng)性能,方案流程圖如圖1所示,發(fā)射端部分主要包括語音信號輸入和信號調(diào)制兩部分,接收端部分主要包括解調(diào)電路和信號處理兩部分.
圖1 調(diào)頻水聲語音通信系統(tǒng)流程圖Fig.1The process of frequency modulation underwater acoustic voice communication system
在接收端,從換能器接收到的信號經(jīng)過放大濾波等前置處理以后,再經(jīng)過非線性解調(diào),解調(diào)語音一路可供直接輸出,另外一路送入數(shù)字處理器完成時間反轉處理過程,即:首先通過同步定位將探針和信號取出來,并保存;接著將探針信號反轉,并與解調(diào)語音做卷積計算;最終得到經(jīng)過多徑聚焦的語音輸出.
由于是基于調(diào)頻語音通信系統(tǒng)進行時間反轉處理,本系統(tǒng)無需采用聲碼器,系統(tǒng)復雜度較低,易于實現(xiàn);同時系統(tǒng)保留一路模擬解調(diào)輸出,可在數(shù)字處理器工作異常情況下作為備份輸出,增加冗余性.
表1 調(diào)制參數(shù)設置
Tab.1 System parameters of frequency modulation system modulation
載波頻率/kHz換能器帶寬/kHz探針長度/ms語音長度/s間隔長度/ms調(diào)制帶寬/kHz調(diào)制靈敏度探針采樣率/kHz語音采樣率/kHz調(diào)制方式2520~30505.37033322~282×π×300084DDS調(diào)制
4海洋試驗結果及分析
4.1試驗環(huán)境
為了驗證本文調(diào)頻水聲語音通信系統(tǒng)的性能,在廈門市五緣灣海域進行了海洋試驗.海域為半封閉結構,平均水深約為10 m,發(fā)射、接收換能器放置深度均為3 m左右,接收、發(fā)射換能器之間距離1 km左右.圖2為試驗海域聲速梯度曲線.
圖2 聲速梯度Fig.2Sound speed gradient
4.2試驗系統(tǒng)設置
發(fā)射信號調(diào)制具體參數(shù)設置如表1所示.信號調(diào)制部分采用直接數(shù)字式頻率合成器(direct digital synthesizer,DDS)數(shù)字調(diào)制實現(xiàn),由ARM7-LPC2138和AD9851完成.DDS在頻率轉換時間、相位連續(xù)性、頻率分辨率等各方面性能指標遠遠超過了傳統(tǒng)頻率合成技術水平,提供了優(yōu)于模擬信號源的性能.
頻率調(diào)制信號由語音頻帶探針和語音信號組成.語音頻帶探針為線性掃頻(linear frequency modulation,LFM)信號,掃頻范圍500~1 500 Hz,采樣率8 kHz,長度50 ms.語音信號在探針信號之后,兩者保護間隔為333 ms,試驗語音內(nèi)容為“廈門大學正在進行語音測試”,采樣率4 kHz,長度5.370 s.
試驗系統(tǒng)解調(diào)采用非線性解調(diào)電路[15],解調(diào)語音信號送入PC中進行時間反轉處理,由于時間反轉處理只需處理解調(diào)語音,可以采用較低的采樣率從而有效降低運算復雜度,方便進行嵌入式實現(xiàn).本方案中時間反轉處理的數(shù)據(jù)傳輸速率為4 kbit/s.
為了進行性能評估比較,在同信道下進行OFDM水聲語音通信試驗[8].OFDM語音通信系統(tǒng)采樣率為96 kHz,FFT點數(shù)為4 096,循環(huán)前綴長度為10.67 ms,子載波個數(shù)為200.采用2.4 kbit/s混合激勵線性預測(mixed-excitation linear predictive,MELP)低比特率數(shù)字語音編碼及卷積編碼分別進行信源及信道編碼.
由于OFDM語音通信試驗的傳輸語音內(nèi)容為“語音編碼的實驗”,與本方案傳輸?shù)恼Z音內(nèi)容不同.為了評估系統(tǒng)語音通信性能,本研究采用PESQ對兩種方法的水聲語音通信質(zhì)量進行量化評估.
4.3試驗結果
調(diào)頻水聲語音通信試驗結果如圖3所示,其中圖3(a)和(b)分別為原始語音波形圖和時頻圖,圖3(c)和(d)為調(diào)頻解調(diào)后語音波形圖和時頻圖,圖3(e)和(f)為經(jīng)過時間反轉處理后的語音時域波形和時頻圖.由于淺海信道的多徑效應,從語音波形圖中看出,解調(diào)后的語音信號存在著明顯的噪聲干擾和時、頻擴展現(xiàn)象,極大地影響了解調(diào)語音的質(zhì)量,降低了語音通信性能.圖4為利用探針信號得到的信道響應,可以看出信道存在明顯多徑分量.
圖3 語音波形與時頻圖Fig.3The waveform and spectrogram of speech
圖4 利用探針獲取的信道響應Fig.4Channel response obtained by probe
通過圖3(a)、(c)、(e)方框內(nèi)的波形對比可知,經(jīng)過時間反轉處理后,語音幅度得到了明顯增強;從圖3(b)、(d)、(f)中方框內(nèi)的時頻特征比較結果可以明顯看出,傳輸過程中因多徑信道導致的語音頻譜擴散效應得到了明顯的抑制.
PESQ語音質(zhì)量客觀評價方法的滿分為4.50,試驗中調(diào)頻解調(diào)語音得分為2.23,經(jīng)過時間反轉處理后語音得分為2.78;由于試驗信道多徑較為明顯,同一信道下的OFDM語音通信糾錯后的誤碼率為11.87%,對應的OFDM體制接收語音的PESQ質(zhì)量評估得分為2.35.
由此可發(fā)現(xiàn),從PESQ得分反映,在海洋試驗信道多徑較為明顯的情況下,時間反轉處理前調(diào)頻方法傳輸語音質(zhì)量稍差于OFDM水聲語音通信質(zhì)量,但經(jīng)過本研究的時間反轉處理后語音質(zhì)量得到改善從而優(yōu)于OFDM方法.
通過PESQ方法對語音進行質(zhì)量評估可得出,時間反轉處理能有效提高多徑信道下的調(diào)頻水聲語音通信質(zhì)量.同時,PESQ方法提供了從語音質(zhì)量角度量化評價語音通信系統(tǒng)性能的評估手段.
5結論
本研究針對多徑條件下傳統(tǒng)水聲語音通信系統(tǒng)性能下降的問題,通過在調(diào)頻語音通信體制中引入了時間反轉聚焦多徑能量,提高系統(tǒng)對于多徑效應的適應性.海上語音通信試驗結果表明,所提出時間反轉調(diào)頻水聲語音通信方案的語音通信性能良好,在多徑條件下解調(diào)語音質(zhì)量較高.
參考文獻:
[1]STOJANOVIC M.Underwater acoustic communications[C]∥Electro/95 International Professional Program Proceedings.Boston:IEEE,1995:435-440.
[2]姜衛(wèi)東,李霞.水下語音通信系統(tǒng)的實時實現(xiàn)[J].艦船電子工程,2010,12(30):91-93
[3]陳冰,尹祿,趙安邦,等.基于OFDM技術的水聲語音通信系統(tǒng)設計與實現(xiàn)[J].海軍工程大學學報,2012,24(6):70-74.
[4]殷敬偉,王馳,白夜,等.基于正交頻分復用的水下語音通信應用研究[J].兵工學報,2013,34(5):593-596.
[5]曾堃,周躍海,童峰.時頻差分OFDM水聲語音通信系統(tǒng)的設計與實現(xiàn)[J].廈門大學學報(自然科學版),2015,54(3):404-408.
[6]曾曉珊.基于模式調(diào)頻的水聲通信方法[D].廣州:華南理工大學,2012:4-6.
[7]黃紹.基于PESQ估測模型的水聲語音通信系統(tǒng)研究[D].廈門:廈門大學,2013:84-85.
[8]周躍海,江偉華,陳磊,等.采用時反和時頻差分OFDM的水聲語音通信方法[J].應用聲學,2015(4):283-290.
[9]殷敬偉,張曉,趙安邦,等.時間反轉鏡在水聲通信網(wǎng)上行通信中的應用[J].哈爾濱工程大學學報,2011,32(1):1-5.
[10]陳國,胡修林,張?zhí)N玉,等.語音質(zhì)量客觀評價方法研究進展[J].電子學報,2001,29(4):548-552.
[11]肖東,莫福源,陳庚,等.水聲通信中低碼速率語音編碼算法的研究[J].聲學學報,2013,38(5):589-596.
[12]QIAO Z,SUN L,IFEACHOR E.Case study of PESQ performance in live wireless mobile VoIP environment[C]∥IEEE 19th International Symposium on Personal,Indoor and Mobile Radio Communications.Cannes:IEEE,2008:1-6.
[13]吳伯修,沈連豐.調(diào)頻技術理論及新進展[M].北京:人民郵電出版社,1988:7-8.
[14]孫軼源,朱維杰,李志舜,等.數(shù)字調(diào)頻信號解調(diào)的新方法[J].西北工業(yè)大學學報,2001,19(4):584-587.
[15]SONG A J,BADIEY M,NEWHALL A E,et al.Passive time reveral acoustic communications through shallow-water internal waves[J].IEEE Journal of Oceanic Engineering,2010,35(4):756-765.
[16]SONG A J,BADIEY M,MCDONALD V K,et al.Time reversal receivers for high data rate acoustic multiple-input-multiple-output communication[J].IEEE Journal of Oceanic Engineering,2011,36(4):525-528.
doi:10.6043/j.issn.0438-0479.201512006
收稿日期:2015-12-05錄用日期:2016-01-22
基金項目:國家自然科學基金(11274259,11574258);福建省中青年教師教育科研項目(JA14008)
*通信作者:ftong@xmu.edu.cn
中圖分類號:TN 912.3
文獻標志碼:A
文章編號:0438-0479(2016)04-0570-05
Frequency Modulation Underwater Acoustic Voice Communication Technology with Time Reversal
WU Yanyi,LI Jianwen,TONG Feng*
(Key Laboratory of Underwater Acoustic Communication and Marine Information Technology,Ministry of Education,College of Ocean & Earth Sciences,Xiamen University,Xiamen 361102,China)
Abstract:As the underwater acoustic channel is a hostile channel with serious time varying, multipath effect, high-noise among others, research and design of the high performance underwater acoustic voice communication is highly challenging. Frequency modulation (FM) technology bears strong anti-jamming ability, which is convenient to be implemented. However, the communication performance of FM is seriously affected under the underwater channel with multipath, high-background noise among others. For the purpose of improving the underwater voice communication performance under multipath conditions, this paper introduces the time-reversal mirror technology to the design of underwater FM voice communication system, which can concentrate multipath and improve signal-to-noise ratio (SNR). Finally, this paper adopts the PESQ to evaluate the FM underwater speech quality. Via the sea trial experiment, time-reversal mirror technology can improve the communication performance of the proposed system.
Key words:underwater acoustic voice communication;frequency modulation (FM);time reversal;multipath channel
引文格式:吳燕藝,李劍汶,童峰.采用時間反轉的調(diào)頻水聲語音通信方法[J].廈門大學學報(自然科學版),2016,55(4):570-574.
Citation:WU Y Y,LI J W,TONG F.Frequency modulation underwater acoustic voice communication technology with time reversal[J].Journal of Xiamen University(Natural Science),2016,55(4):570-574.(in Chinese)