摘" 要: 為提升多軌道數(shù)字音頻信號(hào)的峰值信噪比,降低噪聲,使音頻更加清晰,提出噪聲環(huán)境中多軌道數(shù)字音頻信號(hào)降噪方法。使用二進(jìn)小波分解多軌道數(shù)字音頻,將信號(hào)分解為不同的頻率子帶,使得噪聲和信號(hào)在頻率域上分離。通過模極大值計(jì)算分解信號(hào)的奇異性,由于信號(hào)和噪聲在相同奇異性時(shí)的變化不同,因此能夠確定信號(hào)中的噪聲特點(diǎn),利用層間相關(guān)搜索法找到分解后信號(hào)中的噪聲并去除,最后使用交替投影法將去除噪聲的分解信號(hào)重構(gòu),得到去除噪聲的多軌道數(shù)字音頻信號(hào)。實(shí)驗(yàn)結(jié)果表明:使用該方法進(jìn)行降噪后,存在噪聲的信號(hào)幅值得到了控制,一些單獨(dú)突出可認(rèn)定為噪聲的信號(hào)基本消失;對(duì)低峰值信噪比的信號(hào)降噪,平均峰值信噪比提升了28 dB。
關(guān)鍵詞: 多軌道; 數(shù)字音頻信號(hào); 信號(hào)降噪; 二進(jìn)小波; 信號(hào)分解; 模極大值; 奇異性; 交替投影法
中圖分類號(hào): TN911?34" " " " " " " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " " "文章編號(hào): 1004?373X(2024)13?0019?04
Noise reduction method for multi?track digital audio signal in noisy environment
ZHAO Dan, LI Rui
(Guangdong Ocean University, Zhanjiang 524000, China)
Abstract: A noise reduction method for multi?track digital audio signals in noisy environments is proposed to improve the peak signal?to?noise ratio (PSNR) of multi?track digital audio signals and reduce noise, so as to make the audio clearer. Dyadic wavelet decomposition is used for multi?track digital audio, and the signal is decomposed into different frequency sub bands to separate noise and signal in the frequency domain. The singularity of the decomposed signal is calculated by the modulus maximum. Because of the different variations of the signal and noise at the same singularity, the noise characteristics in the signal can be determined. The interlayer correlation search method is used to find out the noise in the decomposed signal and remove it. Finally, the alternating projection method is used to reconstruct the decomposed signal that has been denoised, so as to obtain a multi?track digital audio signal that has been denoised. The experimental results show that the amplitude of signals with noise is controlled after using this method for denoising, and some single prominent signals that can be identified as noise are eliminated basically. The average PSNR of the signal with low peak SNR has been increased by 28 dB.
Keywords: multi?track; digital audio signal; signal noise reduction; dyadic wavelet; signal decomposition; modulus maximum; singularity; alternating projection method
0" 引" 言
多軌道音頻信號(hào)中包含多個(gè)不同的聲道,這些聲道之間可能存在復(fù)雜的相互干擾和噪聲[1?2]。因此,如何有效地降低噪聲并保留信號(hào)的原始特性是一個(gè)具有挑戰(zhàn)性的問題。多軌道數(shù)字音頻信號(hào)的降噪方法可以分為兩大類:時(shí)域降噪和頻域降噪,在實(shí)際應(yīng)用中通常需要根據(jù)具體情況進(jìn)行選擇和優(yōu)化。
文獻(xiàn)[3]通過重構(gòu)模型和譜減法提取噪聲特征實(shí)現(xiàn)降噪。然而,對(duì)于低信噪比信號(hào),譜減法可能難以有效分離噪聲和信號(hào),而對(duì)于高信噪比信號(hào),飽和效應(yīng)可能導(dǎo)致信號(hào)細(xì)節(jié)丟失。文獻(xiàn)[4]利用VMD和SVD分解音頻信號(hào),通過峭度原則優(yōu)化SVD參數(shù)以提取噪聲特征。但峭度的選擇和參數(shù)調(diào)整需根據(jù)信號(hào)特點(diǎn)進(jìn)行,可能影響降噪性能。文獻(xiàn)[5]基于生成對(duì)抗網(wǎng)絡(luò)構(gòu)建降噪模型,并引入擴(kuò)展卷積結(jié)構(gòu)和遷移學(xué)習(xí)策略。盡管考慮了小樣本情況,但訓(xùn)練耗時(shí)且參數(shù)優(yōu)化復(fù)雜,不適用于高質(zhì)量降噪需求。文獻(xiàn)[6]通過立體聲接收器信號(hào)和信號(hào)處理規(guī)則實(shí)現(xiàn)降噪,保留了立體聲分離和頻率響應(yīng)。但在處理復(fù)雜噪聲和信號(hào)時(shí),可能引入失真,影響降噪效率。
二進(jìn)小波具有時(shí)間和頻率上的局部化特性[7],能夠有效地捕捉信號(hào)的瞬時(shí)變化,并且二進(jìn)小波可以令噪聲和信號(hào)在頻域上分離。層間相關(guān)搜索去噪可以在去除噪聲的同時(shí)保留信號(hào)的細(xì)節(jié)部分,從而避免信號(hào)失真,并且層間相關(guān)搜索具有極好的魯棒性,基于此,本文提出噪聲環(huán)境中多軌道數(shù)字音頻信號(hào)降噪方法。
1" 多軌道數(shù)字音頻信號(hào)降噪方法
1.1" 基于二進(jìn)小波的多軌道數(shù)字音頻信號(hào)分解
對(duì)于一個(gè)平方可積的函數(shù)集合[L2],對(duì)集合中的任意函數(shù)進(jìn)行小波變換:
[ψa,bt=ψt-baa," " a∈R-0, b∈R] (1)
式中:[a]、[b]為尺度和位移因子;[ψ]為基本小波。
對(duì)連續(xù)的小波[ψa,bt]進(jìn)行二進(jìn)制離散處理可得:
[ψ2k,bt=a-k2ψt-b2k] (2)
公式(2)即為二進(jìn)小波[8]。
若有一平滑函數(shù)[θt],且[θt∈L2],對(duì)該函數(shù)進(jìn)行二次求導(dǎo)可得其微分函數(shù):
[ψt=dθtdtψt=d2θtdt2] (3)
式中:函數(shù)[ψt]、[ψt]為小波函數(shù)。
因此對(duì)于多軌道數(shù)字音頻信號(hào)[ft]進(jìn)行二進(jìn)小波變換,可得:
[W′cft=cddtfθcW″cft=c2d2dt2fθc] (4)
式中:[c]為尺度,該尺度決定了[θt]的作用大小。
1.2" 基于模極大值和奇異性指數(shù)的噪聲特征提取
由于多軌道數(shù)字音頻信號(hào)[ft]與[θt]的一階微分極值點(diǎn)與二階微分過零點(diǎn)均為信號(hào)邊緣,因此,本文選擇模極大值計(jì)算多軌道數(shù)字音頻信號(hào)的奇異值[9],從而得到多軌道數(shù)字音頻信號(hào)的噪聲特征。
對(duì)于多軌道數(shù)字音頻信號(hào)[ft],若在尺度[d0]時(shí),有一個(gè)點(diǎn)[d0,e0]可使:
[?Wftd0,e0?e=0] (5)
那么該點(diǎn)便是多軌道數(shù)字音頻信號(hào)[ft]的局部極值點(diǎn),并且該極值點(diǎn)滿足:
[?Wftd0,e0?egt;?Wft-1d0,e0?e?Wftd0,e0?egt;?Wft+1d0,e0?e] (6)
將尺度空間[d,e]中的全部模極大值點(diǎn)進(jìn)行連接,形成的線稱為極大值線。
對(duì)于模極大值和多軌道數(shù)字音頻信號(hào)奇異性有以下定理:
在整數(shù)中,[n]次連續(xù)且有緊支集的多軌道數(shù)字音頻信號(hào)小波[ft∈L1g,h],[g,h∈R]加入在[d0gt;0]且[?dlt;d0],[t∈g,h],多軌道數(shù)字音頻信號(hào)沒有局部極大值點(diǎn),因此可以認(rèn)為在[g+τ,h-τ]區(qū)間存在一致Lipschitz [α](利普希茨)。
當(dāng)對(duì)多軌道數(shù)字音頻信號(hào)進(jìn)行小波分解后,得到的函數(shù)可以使用Lipschitz指數(shù)來描述其奇異性[α]的大小。小波分解后的該點(diǎn)越平滑[α]越大,若[α]越小,則表明該點(diǎn)的奇異性越大?;赱α]的變化可以尋找到多軌道數(shù)字音頻信號(hào)的噪聲,存在多軌道數(shù)字音頻信號(hào)中噪聲的模極大值會(huì)因?yàn)槌叨仍黾佣鴾p小。
1.3" 基于模極大值和交替投影算法的信號(hào)重構(gòu)
1.3.1" 模極大值重構(gòu)信號(hào)
使用二進(jìn)小波分解多軌道數(shù)字音頻信號(hào)后,經(jīng)過降噪處理后需要重構(gòu)才可以重新形成音頻信號(hào)[10]。
假設(shè)存在一個(gè)多軌道數(shù)字音頻信號(hào)的集合[ht],該集合中的信號(hào)使用二進(jìn)小波變換后得到的模極大值與需要降噪的多軌道數(shù)字音頻信號(hào)[ft]具有相同的模極大值。因此可以在某些條件下,將[ht]無限接近[ft],對(duì)[ht]小波變換的結(jié)果記為[W2jht],[ht]需要滿足:
1) 兩數(shù)字音頻信號(hào)在相同尺度[j]下,模極大值的橫坐標(biāo)為[tjn]時(shí)存在:
[W2jhtjn=W2jftjn] (7)
2) 兩數(shù)字音頻信號(hào)在相同尺度[j]下,[W2jht]的局部模極大值均處于[tjn]中。
對(duì)于[ht]無限接近[ft],條件1)僅保證了在[tjn]處[W2jht]具有模極大值,在這種情況對(duì)條件2)需要進(jìn)行變更,即:[W2jht2]在其他位置平均值盡可能小。
為了令[W2jht]的模極大值數(shù)量少以及[W2jhtjn22]最小和[W2jht]的導(dǎo)數(shù)能量最小,因此額外引進(jìn)Sobolev(索伯列夫)范數(shù),Sobolev范數(shù)公式為:
[h2=?∈z2W2jht22+22jdW2jhtdt22] (8)
利用式(8)可以得到初步逼近的[ht],之后采用交替投影算法得到最佳逼近的[ht],從而重構(gòu)出多軌道數(shù)字音頻信號(hào)。
1.3.2" 交替投影算法
假設(shè)存在一個(gè)空間[V],在該空間內(nèi)的小波函數(shù)序列均屬于[L2],以及一個(gè)由[ljt]序列構(gòu)成的空間[K](該空間滿足式(8)),[?][V∈K]。令[K]包含[Φ],且[Φ]為[K]的閉凸子集,在這種情況下二進(jìn)小波變換為序列空間[Δ=V?Φ]內(nèi)的一個(gè)元素。因此,最逼近[fx]的[hx]便是[Δ]中的最小函數(shù),通過在零點(diǎn)進(jìn)行交替投影開始逼近。在空間[V]和空間[Φ]的正交投影算子為[PV]和[PΦ],同時(shí)算子滿足:
[P=PV?PΦ] (9)
式中[P]為交替正交投影算子。
對(duì)任意的序列[x=ljx∈K],如果[ljx=0]則交替的投影收斂于[Δ]空間中,Sobolev范數(shù)達(dá)到最小,即[minεjt22+22jdεjtdt22]。通過算子[P]迭代獲取多軌道音頻數(shù)字信號(hào)[fx]的二進(jìn)小波變換[W2jft],再由[W2jft]重構(gòu)出原始信號(hào)[fx]。
1.4" 基于層間相關(guān)搜索去除噪聲的模極大值
在多軌道數(shù)字音頻信號(hào)利用二進(jìn)小波分解后需要將分解后的信號(hào)中的噪聲去除,本文利用層間關(guān)系搜索法找到噪聲并進(jìn)行去除。利用層間相關(guān)搜索去除噪聲過程如下。
1) 計(jì)算全部尺度的多軌道數(shù)字音頻信號(hào)使用二進(jìn)小波變換后的模極大值點(diǎn)。
2) 由最大尺度[2j]的極值點(diǎn)開始逐步向下進(jìn)行處理:
① 設(shè)最大模極值點(diǎn)幅度為max;
② 設(shè)定噪聲門限:
[T0=(J+R)-1log21+2N] (10)
式中:[J]為模極大值的最大尺度;[N]為噪聲功率。
通過門限即可將幅度小于[T0]、尺度為[2j]的模極大值去除。
3) 向低尺度搜索。設(shè)[2j]尺度的極值點(diǎn)為[xi],則[2j-1]極值點(diǎn)為[x′i],以所在尺度[s]為半徑搜索[x′i]。
若[x′i=xi],表明[x′i]為[xi]傳播點(diǎn),若不存在,則擴(kuò)大搜索范圍到[xi-s, xi+s]。若存在[x′n]為極值點(diǎn)且幅值小于[xi],則將其作為多軌道數(shù)字音頻信號(hào)極值點(diǎn)保留,否則,將其視為噪聲極值點(diǎn)去除。重復(fù)至尺度為[22]結(jié)束。
2" 實(shí)驗(yàn)分析
2.1" 實(shí)驗(yàn)對(duì)象
本文選擇CCMUSIC DATASET數(shù)據(jù)庫部分?jǐn)?shù)據(jù)進(jìn)行實(shí)驗(yàn),選取數(shù)據(jù)庫內(nèi)的具體數(shù)據(jù)情況如表1所示。
2.2" 實(shí)驗(yàn)數(shù)據(jù)
在數(shù)據(jù)庫中隨機(jī)選擇一多軌道數(shù)字音頻信號(hào),該信號(hào)波形如圖1所示,對(duì)該信號(hào)使用本文方法進(jìn)行降噪處理如圖2所示。
通過圖1和圖2對(duì)比可以看出,原始的多音軌音樂的數(shù)字信號(hào)幅值極大,并且有多處單獨(dú)且突出的信號(hào),基本可以認(rèn)為是音樂信號(hào)的噪聲。經(jīng)過本文方法降噪后,可以明顯地看出,音樂信號(hào)的幅值減小,并且在原始音樂信號(hào)中單獨(dú)且突出的聲音信號(hào)消失,整體信號(hào)的波動(dòng)較為平緩。這表明了降噪算法的有效性,能夠顯著改善多音軌音樂信號(hào)的質(zhì)量。
對(duì)數(shù)據(jù)庫中的每類數(shù)據(jù)選擇10條,使用本文方法進(jìn)行降噪,每類數(shù)據(jù)降噪前后的峰值信噪比的平均值如表2所示。
通過表2可以看出,對(duì)數(shù)據(jù)庫內(nèi)的音樂數(shù)據(jù)進(jìn)行降噪有明顯的效果,搖滾樂的峰值信噪比僅提升了13 dB,是因?yàn)閾u滾樂的原始信號(hào)峰值信噪比高。而其他峰值信噪比較低的音樂信號(hào)平均提升了28.7 dB,可見本文方法對(duì)多軌道數(shù)字音頻信號(hào)有著強(qiáng)大的降噪能力。
3" 結(jié)" 論
本文創(chuàng)新性地提出了一種多音軌數(shù)字音頻信號(hào)降噪方法,為音頻去噪領(lǐng)域帶來了新的視角和技術(shù)途徑,實(shí)現(xiàn)了對(duì)噪聲的有效抑制,同時(shí)保留了音樂信號(hào)的質(zhì)感和動(dòng)態(tài)范圍。這種集成方法不僅提高了去噪效果,而且具備自適應(yīng)性強(qiáng)、計(jì)算效率高、魯棒性好、靈活性大和易于實(shí)現(xiàn)等特點(diǎn),是處理多音軌數(shù)字音頻信號(hào)的有效工具。此外,通過精細(xì)調(diào)整算法參數(shù),該方法能夠適應(yīng)不同類型和水平的噪聲,為音頻信號(hào)的后期制作和品質(zhì)提升提供了重要支持。
注:本文通訊作者為李蕊。
參考文獻(xiàn)
[1] 李佳,馬建芬,張朝霞.基于秘密分享和SWT的數(shù)字音頻水印算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2022,43(3):616?623.
[2] 孫夢(mèng)青.基于時(shí)頻域信息提取的數(shù)字音頻樂音識(shí)別仿真[J].計(jì)算機(jī)仿真,2021,38(7):415?418.
[3] 樊一帆,張麗丹.強(qiáng)噪環(huán)境基于譜減法的錄音數(shù)字音頻信號(hào)降噪[J].計(jì)算機(jī)仿真,2023,40(11):433?436.
[4] 李偉光,蘭欽泓,馬賢武.基于峭度原則的VMD?SVD微型電機(jī)聲音信號(hào)降噪方法[J].中國測(cè)試,2023,49(1):111?118.
[5] 李勇斌,王彬,邵高平,等.一種基于RCGAN的水聲通信信號(hào)降噪方法[J].電子學(xué)報(bào),2022,50(1):54?62.
[6] HAHN H P. Method for noise reduction in receiving FM stereo signals [J]. Journal of the audio engineering society: Audio, acoustics, applications, 2022, 70(3): 208?238.
[7] 王翠,鄧彩霞,劉國寧,等.一個(gè)二進(jìn)小波變換像空間的再生核函數(shù)[J].高等學(xué)校計(jì)算數(shù)學(xué)學(xué)報(bào),2021,43(1):1?15.
[8] 汪思?jí)?,田中旭,魯洪?改進(jìn)小波包降噪與RSSD的滑動(dòng)軸承聲音診斷方法[J].機(jī)械設(shè)計(jì)與研究,2023,39(3):121?125.
[9] 朱紅求,程菲,胡浩南,等.基于FFT奇異值分解的光譜信號(hào)去噪算法[J].光譜學(xué)與光譜分析,2022,42(1):277?281.
[10] 王軼楷,謝銳.基于CEEMDAN和改進(jìn)小波模極大值的高低頻混合信號(hào)去噪算法[J].中北大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,44(4):366?373.
[11] 李煒,劉禹,李立剛,等.基于自適應(yīng)降噪的柱塞泵故障音頻特征提取方法[J].國外電子測(cè)量技術(shù),2023,42(1):1?6.
[12] 吳蘭,楊攀,李斌全,等.大詞匯量環(huán)境噪聲下的多模態(tài)視聽語音識(shí)別方法[J].廣西科學(xué),2023,30(1):52?60.
[13] 張珺,趙玉霞.基于改進(jìn)小波變換及神經(jīng)網(wǎng)絡(luò)的電子音樂信號(hào)識(shí)別方法[J].自動(dòng)化技術(shù)與應(yīng)用,2023,42(5):48?51.