亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        自訓(xùn)練過完備字典和稀疏表示的語音增強

        2015-04-12 00:00:00崔曉
        現(xiàn)代電子技術(shù) 2015年13期

        摘 要: 提出的算法利用帶噪信號進行訓(xùn)練以獲得過完備字典,通過設(shè)定較大的字典訓(xùn)練閾值,訓(xùn)練過程只對語音信號進行,使得自訓(xùn)練字典與語音信號之間相關(guān)性較強。利用該字典和較小的閾值對語音信號進行稀疏表示,進而實現(xiàn)語音增強。仿真實驗表明,增強后的信號表示系數(shù)稀疏度更強,增強效果在信噪比(SNR)和感知語音質(zhì)量評估(PESQ)得分方面均有較大改進。

        關(guān)鍵詞: 正交匹配追蹤; 迭代閾值; 字典訓(xùn)練; 語音增強

        中圖分類號: TN912.3?34 文獻標(biāo)識碼: A 文章編號: 1004?373X(2015)13?0056?03

        Abstract: In the proposed algorithm, the dictionary is trained by the signal with noise to obtain over?complete dictionary. By setting the bigger dictionary training threshold, the correlation between self?training dictionary and speech signal stronger is enhanced. The training process aims to speech signal only. The dictionary and the smaller threshold are used to conduct sparse representation of speech signal, and then speech enhancement is realized. Simulation experiment results show that the expression coefficient sparsity of the enhanced signal is stronger, the enhancement effects are greatly improved in scoring aspect of signal?to?noise ratio (SNR) and perceptual evaluation of speech quality (PESQ).

        Keywords: orthogonal matching tracking; iterative threshold; dictionary training; speech enhancement

        0 引 言

        語音信號是人類交流過程中最自然、最常用的方式,語音增強能降低噪聲提高信噪比,是語音信號預(yù)處理的一個重要過程。在稀疏表示中,利用過完備字典中少數(shù)原子的線性組合來表示樣本信號,其優(yōu)勢是有更大的靈活性和噪聲情況下更強的穩(wěn)定性,因而成為目前研究較多的算法,在語音壓縮[1]、識別[2]以及語音增強[3?4]方面均得到較為廣泛的應(yīng)用。在基于稀疏表示的語音增強中,過完備字典的構(gòu)成起著一個非常關(guān)鍵的作用[5],良好的字典能夠使純凈語音信號的表示更加稀疏,從而與噪聲的區(qū)分度更為顯著。在這個過程中,為了得到更為稀疏的系數(shù),所采用的字典從過完備離散余弦變換、過完備小波變換等固定字典到參數(shù)化字典設(shè)計,進而采用自適應(yīng)字典學(xué)習(xí)算法訓(xùn)練字典,使字典與被處理信號之間的相關(guān)性增強[6?7]。文獻[8]利用純凈信號訓(xùn)練字典,將語音激活檢測估計的噪聲作為重構(gòu)閾值,對含噪語音進行稀疏分解,將系數(shù)與字典重構(gòu)得到無噪的語音信號。然而,在語音增強處理的過程中目標(biāo)語音是受到噪聲污染的,純凈語音只能是其他語音信號。本文算法利用閾值正交匹配追蹤(OMP)和K奇異值分解算法(K?svd)直接對含噪語音進行字典訓(xùn)練,得到的字典與語音信號有更強的相關(guān)度,因而得到的表示系數(shù)更為稀疏,在語音增強時取得更好的效果。

        1 帶噪語音信號的稀疏重構(gòu)

        設(shè)觀測到的帶噪語音信號為:

        [y(n)=x(n)+z(n)]

        式中:[z(n)]是方差為[σ2]的高斯白噪聲;[x(n)]表示純凈語音信號;[n]表示各樣值所在時刻(為表達方便,以下省去[n])。

        在無噪情況下,分幀后的純凈語音信號[x∈RM×N]是幀長為[M,]幀數(shù)為[N]的信號。對于一個過完備字典[D∈RM×L,][L>M]表示字典的冗余性。[x]可以在該字典下表示為:

        [x=D*A] (1)

        式中:[A]是系數(shù),它是一個[L×N]的矩陣,各列矢量[A(:,n)0?M,]其中[1≤n≤N;][0]代表0?范數(shù)。在稀疏表示中,每幀語音信號的非0系數(shù)個數(shù)遠小于信號長度。

        對于一個適合的過完備字典[D,]語音成分在其上的系數(shù)是稀疏的,而白噪聲則不具備這種特性。當(dāng)已知噪聲方差[σ2]的情況下,在進行原子選擇時通過設(shè)定與其有關(guān)的恰當(dāng)?shù)拈撝礫ε,]可以控制只從帶噪信號中選出與純凈語音相關(guān)的系數(shù),而摒棄與噪聲有關(guān)的系數(shù)以實現(xiàn)語音增強。

        2 閾值正交匹配追蹤算法

        在信號的稀疏表示中,由于字典的過完備性,[x]在由[D]構(gòu)成的冗余基上的稀疏表示系數(shù)[A]的求解是一個非常困難的過程。快速穩(wěn)定的稀疏分解與重構(gòu)算法起著重要的作用,OMP屬于貪婪方法的一種,在精度要求相同的情況下,OMP由于更快且更容易實現(xiàn)而得到廣泛的應(yīng)用。

        為得到最優(yōu)的稀疏表示結(jié)果,OMP使第[k]個殘差[Rk]與當(dāng)前信號的近似值[yk]正交,此時該殘差與當(dāng)前[yk]的任意一個原子都線性無關(guān),從而在之后的分解過程中,不會出現(xiàn)之前[yk]中已經(jīng)選擇過的原子,因此是最優(yōu)的。傳統(tǒng)的OMP先將選中原子進行正交化處理,然后再將殘差在這些正交原子基上進行分解,以保證殘差與所選中的全部原子正交。改進算法在信號投影過程中,將原信號在所選中的所有原子的列空間進行正交投影,所得殘差與這些被選中的原子都正交[9]。本文采用的閾值正交匹配追蹤算法中,設(shè)定迭代結(jié)束的閾值條件,當(dāng)原始信號與重構(gòu)信號的殘差小于該閾值時,停止迭代。

        本文閾值正交匹配追蹤算法描述如下:

        輸入:過完備字典[D,]原始信號[y,]迭代閾值[ε;]輸出:稀疏系數(shù)[A,]稀疏近似所得信號[y(k)。]

        處理過程如下:

        (1) 初始化:殘差[r(0)=y,]選中原子索引集[Λ0=?,]迭代次數(shù)[k=1;]

        循環(huán)執(zhí)行步驟(2)~步驟(6):

        (2) 計算殘差[r(k-1)]與字典[D]各個原子[dj]的內(nèi)積,找出最大內(nèi)積絕對值所對應(yīng)的原子[dj]下標(biāo)[λ,]用公式表示為:[λ=argmaxjr(k-1),dj];

        (3) 更新索引集[Λ(k),Λ(k)(k)=λ。]將步驟(2)選中的原子加入到選中的原子集合中,更新已選中原子的集合[D(k)=[D(k-1),dλ];]

        (4) 根據(jù)最小二乘法,將[y]在選中的所有原子組成的空間進行投影,計算[k]階逼近的系數(shù)[A:][A(k)=argmin:y-D(k)A2;]

        (5) 更新信號估計值和殘差[y(k)=D(k)A(k),][r(k)=y-y(k);]

        (6) 計算殘差的Frobenius范數(shù)[r(k)2,]若小于迭代閾值,則結(jié)束;否則[k=k+1,]轉(zhuǎn)至步驟(2)進入下一輪循環(huán)。

        3 語音樣本自訓(xùn)練生成的過完備字典

        對于給定的語音樣本[Y,]通過訓(xùn)練設(shè)計其最佳表示字典的算法就是尋找字典[D]的各個原子,以及相應(yīng)的稀疏系數(shù)[A]的過程,這個運算過程可按下式進行:

        [minA(:,n)0,?n∈[1,N] s.t. Y-DA2≤ε] (2)

        初始化的字典可以選擇過完備離散余弦基、隨機信號或者待訓(xùn)練信號的幀樣本作為訓(xùn)練的初始值,這個過程要保證字典按列歸一化,即單位歐幾里德范數(shù)。在初始化字典選定后,設(shè)定迭代次數(shù)[k],整個字典學(xué)習(xí)在稀疏編碼與字典更新之間迭代完成。每次迭代包括兩個步驟:

        (1)稀疏編碼階段。對給定的訓(xùn)練樣本[y],利用閾值正交匹配追蹤從當(dāng)前的字典[D]中選擇最佳原子,求出稀疏表示的系數(shù)[A]。

        (2)字典更新。針對步驟(1)得到的稀疏系數(shù)[A,]更新字典中每一列即各個原子。K?svd算法通過對殘差矩陣進行奇異值分解,用最大特征值所對應(yīng)的向量更新字典的一列,同時更新該列相對應(yīng)的系數(shù)[A]的行元素,為保證系數(shù)的稀疏性,在奇異值分解計算時只用與待更新字典的列有關(guān)的殘差信號[10]。

        4 提出算法描述及性能評估

        4.1 算法描述

        綜前所述,本文提出的語音增強算法可描述為:

        (1) 噪聲方差估計。對觀測到的帶噪語音信號利用其前3 000個樣本估計噪聲方差[σ2]。

        (2) 字典訓(xùn)練。設(shè)定字典訓(xùn)練閾值[ε1=k1Mσ]作為K?svd字典訓(xùn)練時閾值OMP的迭代結(jié)束條件,初始化字典選擇過完備離散余弦基,利用分幀后帶噪語音信號訓(xùn)練字典[D。]

        (3) 稀疏增強。設(shè)定稀疏表示閾值[ε2=k2Mσ],對分幀后帶噪語音信號根據(jù)步驟(2)訓(xùn)練的字典和[ε2]采用閾值OMP分解,得到估計的純凈語音信號系數(shù)[A。]

        (4) 語音合成。由[x=DA]計算增強后的分幀語音信號,最后通過迭代相加法(OLA)得到增強的語音。

        在帶噪語音字典訓(xùn)練和語音信號分解的過程中,均通過閾值OMP求解系數(shù)。反復(fù)實驗表明,為使訓(xùn)練的字典只與語音信號相關(guān),步驟(1)中[k1]取值為1.6,即設(shè)置較大的迭代閾值;在語音增強中,要獲得較大的信噪比和失真度較小的語音,[k2]值設(shè)定為1.05,此時迭代閾值比噪聲略大。由于自訓(xùn)練的字典與語音信號較強的相關(guān)性,在純噪聲區(qū)系數(shù)為0,而帶噪語音區(qū)則只得到純凈語音的分解,從而達到語音增強的目的。

        4.2 提出算法的性能評估

        實驗采用中國科學(xué)院自動化研究所開發(fā)的CASIA98?99語音測試庫,從中選取女生語料5人次和男生語料5人次作為純凈語音,為便于仿真處理,所有語音采樣率轉(zhuǎn)換為[fs]=8 000 Hz。所加噪聲為計算機隨機產(chǎn)生的白噪聲,信噪比分別為-5 dB,0 dB,5 dB,10 dB,15 dB,20 dB。仿真幀長取為128,字典中原子個數(shù)為384,字典冗余度為3,字典訓(xùn)練時幀移為2,迭代次數(shù)為3次,稀疏增強時幀移為8,對提出算法進行仿真。

        4.2.1 波形圖與語譜圖比較

        如圖1所示,從上至下依次為一段原始純凈語音信號、加5 dB噪聲信號以及用提出算法增強后的信號對比。圖1(a)為信號隨時間變化的波形圖,圖1(b)為圖1(a)語音信號隨時間變化波形圖與相對應(yīng)的信號語譜圖。

        時域波形圖和語譜圖顯示,語音信號幾乎被5 dB白噪聲淹沒,尤其是語譜圖,僅有少量語音可見。然而經(jīng)增強處理的信號,信噪比則達14.42 dB,語音波形與原始信號極為相似,語譜圖也較為清晰。表明提出的算法對即使受較強噪聲污染的信號依然有較好的處理能力,這對于語音識別和通信預(yù)處理而言非常重要。

        4.2.2 對比實驗性能測試

        為進一步研究提出算法的性能,將提出算法與文獻[8]中算法增強效果進行比較。測試方法為10種語音信號在不同信噪比下測試數(shù)據(jù)的平均值作為實驗結(jié)果,主要測試增強后的信噪比(SNR)、感知語音質(zhì)量評估(PESQ)得分以及稀疏程度比較,其中稀疏程度通過增強信號每幀非0系數(shù)的個數(shù)平均值來反映,該值越小表明增強信號的能量集中在較少的系數(shù),因而稀疏程度越高。對比結(jié)果見表1。

        表1中數(shù)據(jù)顯示,在語音增強過程中,使用帶噪信號本身訓(xùn)練字典,所得的信噪比與對比算法均有提高,最大提升值是15 dB時的1.43 dB,從PESQ得分的角度和增強信號的稀疏程度來看,提出算法除了-5 dB輸入信噪比的信號外,均有所提升,最大PESQ得分提升值是15 dB時的0.20,最大稀疏程度提升值是15 dB時的2.31。究其原因,對于-5 dB而言,過大的噪聲使得訓(xùn)練字典所用的語音成分較少,所得字典與語音的相關(guān)度較小,因而提升效果不如對比算法。

        5 結(jié) 論

        本文在字典訓(xùn)練階段利用帶噪語音信號自身進行訓(xùn)練,通過設(shè)置較高的閾值,只對語音成份進行訓(xùn)練得到過完備字典。在增強階段通過設(shè)置稍高于噪聲方差的迭代閾值,利用自身訓(xùn)練字典與語音信號之間較強的相關(guān)性,得到更為稀疏的表示系數(shù),獲取純凈的增強語音。仿真結(jié)果表明,提出算法能顯著地抑制背景噪聲,在信噪比和PESQ得分方面均優(yōu)于對比算法,可以提高語音信號的質(zhì)量,在微處理器速度日漸提高的情況下不失為一種更佳的選擇。

        參考文獻

        [1] 王天荊,鄭寶玉,楊震.基于自適應(yīng)冗余字典的語音信號稀疏表示算法[J].電子與信息學(xué)報,2011,33(10):2372?2377.

        [2] LI W F, ZHOU Y, POH N, et al. Feature denoising using joint sparse representation for in?car speech recognition [J]. IEEE Signal Processing Letters, 2013, 20(7): 681?684.

        [3] 周小星,王安娜,孫紅英,等.基于壓縮感知過程的語音增強[J].清華大學(xué)學(xué)報:自然科學(xué)版,2011,51(9):1234?1238.

        [4] 程經(jīng)士.壓縮感知理論在語音信號去噪中的應(yīng)用[J].現(xiàn)代電子技術(shù),2012,35(7):84?85.

        [5] 趙慧民,倪霄.壓縮感知的冗余字典及其迭代軟閾值實現(xiàn)算法[J].電路與系統(tǒng)學(xué)報,2013,18(1):59?64.

        [6] SIGG C, DIKK T, BUHMANN J M. Speech enhancement using generative dictionary learning [J]. IEEE Transactions on Audio, Speech, and Language Processing, 2012, 20(6): 1698?1712.

        [7] 李軼南,張雄偉,曾理,等.改進的稀疏字典學(xué)習(xí)單通道語音增強算法[J].信號處理,2014,30(1):44?50.

        [8] 孫林慧,楊震.基于數(shù)據(jù)驅(qū)動字典和稀疏表示的語音增強[J].信號處理,2011,27(12):1793?1800.

        [9] TROPP J, GILBERT A. Signal recovery from random measurements via orthogonal matching pursuit [J]. Transactions on Information Theory, 2007, 53(12): 4655?4666.

        [10] AHARON M, ELAD M, BRUCKSTEIN A. K?SVD: an algorithm for designing overcomplete dictionaries for sparse representation [J]. IEEE Transactions on Signal Processing, 2006, 54(11), 4311?4322.

        久久久久久亚洲精品中文字幕| 成人中文乱幕日产无线码| 亚洲天堂av大片暖暖| 亚洲中文字幕视频第一二区| 偷拍夫妻视频一区二区| 曰韩无码无遮挡a级毛片| av潮喷大喷水系列无码| 亚洲中文字幕无码久久2018| 国产传媒剧情久久久av| 国产成人精品久久二区二区91| 日韩精品 在线 国产 丝袜| 欧美 国产 综合 欧美 视频| 无码国产精品一区二区免费16| 亚洲色图在线视频免费观看 | 成人无码免费一区二区三区| 欧美性一区| av天堂一区二区三区精品| 丰满少妇被猛进去高潮| 国产内射爽爽大片视频社区在线| 婷婷丁香五月中文字幕| 亚洲成av人无码免费观看| 国产亚洲一区二区精品| 亚洲欧洲av综合色无码| 亚洲国产另类精品| 国产精品久久久| 一区二区三区国产在线网站视频| 美女人妻中文字幕av| 亚洲精品中文字幕一区二区| 久久成人国产精品免费软件| 久久精品日韩av无码| 国产青青草自拍视频在线播放| 手机久草视频福利在线观看| 免费无码av片在线观看播放| 国产精品亚洲成在人线| 亚洲精品无人区一区二区三区| 国产三区二区一区久久| 日本少妇高潮喷水xxxxxxx| 成年女人毛片免费视频| 精品日产一区2区三区| 在线观看一区二区三区国产| 国产在线无码精品无码|