亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種時(shí)頻平滑的深度神經(jīng)網(wǎng)絡(luò)語音增強(qiáng)方法

        2019-08-20 03:47:26袁文浩梁春燕婁迎曦王志強(qiáng)
        關(guān)鍵詞:時(shí)頻語音卷積

        袁文浩,梁春燕,婁迎曦,房 超,王志強(qiáng)

        (山東理工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,山東 淄博 255000)

        近年來,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,基于深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network,DNN)的語音增強(qiáng)受到人們的廣泛關(guān)注。得益于深度神經(jīng)網(wǎng)絡(luò)強(qiáng)大的建模能力,通過對大量含有不同類型噪聲的含噪語音樣本數(shù)據(jù)進(jìn)行訓(xùn)練與學(xué)習(xí),該類方法相比傳統(tǒng)的基于統(tǒng)計(jì)的語音增強(qiáng)方法在低信噪比和非平穩(wěn)噪聲環(huán)境下表現(xiàn)出更好的語音增強(qiáng)性能[1-3]。

        為了提高基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法的性能,研究人員設(shè)計(jì)了多種不同的訓(xùn)練目標(biāo),并嘗試采用不同的網(wǎng)絡(luò)結(jié)構(gòu)來建立語音增強(qiáng)模型。以含噪語音的理想二值掩碼作為訓(xùn)練目標(biāo),文獻(xiàn)[4]中采用全連接神經(jīng)網(wǎng)絡(luò)來訓(xùn)練一個(gè)二值分類器,通過對含噪語音中的各個(gè)時(shí)頻單元進(jìn)行分類得到對純凈語音的估計(jì)。文獻(xiàn)[5]中采用連續(xù)的理想比率掩碼代替理想二值掩碼作為訓(xùn)練目標(biāo),并通過實(shí)驗(yàn)驗(yàn)證了:在相同結(jié)構(gòu)的全連接神經(jīng)網(wǎng)絡(luò)下,理想比率掩碼相比理想二值掩碼顯著地提升了語音增強(qiáng)模型的性能。為了在基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法中融入對相位信息的估計(jì),文獻(xiàn)[6]中設(shè)計(jì)了一種復(fù)數(shù)域上的訓(xùn)練目標(biāo)——復(fù)數(shù)理想比率掩碼,通過訓(xùn)練全連接神經(jīng)網(wǎng)絡(luò)同時(shí)估計(jì)純凈語音復(fù)數(shù)域特征的實(shí)部和虛部,間接實(shí)現(xiàn)了對純凈語音幅度和相位的同步估計(jì)。與上述基于時(shí)頻掩蔽的訓(xùn)練目標(biāo)不同,文獻(xiàn)[7-8]直接使用歸一化后的純凈語音的對數(shù)功率譜作為訓(xùn)練目標(biāo),通過訓(xùn)練全連接神經(jīng)網(wǎng)絡(luò)建立一個(gè)從含噪語音對數(shù)功率譜到純凈語音對數(shù)功率譜的非線性映射關(guān)系。

        另外,由于絕大多數(shù)的語音增強(qiáng)方法都是針對時(shí)頻域進(jìn)行設(shè)計(jì)的,而語音信號(hào)在時(shí)間和頻率兩個(gè)維度上表現(xiàn)出來的二維相關(guān)性與圖像非常類似,因此文獻(xiàn)[12-13]中借鑒圖像處理領(lǐng)域中廣泛應(yīng)用的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來處理語音增強(qiáng)問題。文獻(xiàn)[12]中采用全卷積神經(jīng)網(wǎng)絡(luò)構(gòu)造一個(gè)編碼器-解碼器模型來表達(dá)含噪語音時(shí)頻譜和純凈語音時(shí)頻譜之間的映射關(guān)系,由于采用了全卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),相比全連接神經(jīng)網(wǎng)絡(luò),該模型參數(shù)的數(shù)量顯著減小。文獻(xiàn)[13]中采用卷積神經(jīng)網(wǎng)絡(luò)建立了一種信噪比感知的語音增強(qiáng)模型,并通過實(shí)驗(yàn)驗(yàn)證了卷積神經(jīng)網(wǎng)絡(luò)相比全連接神經(jīng)網(wǎng)絡(luò)能夠更好地提取語音信號(hào)的局部時(shí)頻特征,因而具有更好的語音增強(qiáng)性能。

        綜合分析已有的基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法,其在網(wǎng)絡(luò)結(jié)構(gòu)的設(shè)計(jì)上一般基于圖像領(lǐng)域或語音識(shí)別中的成功案例,并沒有針對語音增強(qiáng)問題自身的特點(diǎn)來設(shè)計(jì)網(wǎng)絡(luò)。實(shí)際上,不管是傳統(tǒng)的基于統(tǒng)計(jì)的語音增強(qiáng)方法還是基于深度神經(jīng)網(wǎng)絡(luò)的語音增方法,其對含噪語音中語音成分的估計(jì)都是基于含噪語音的局部特征;而在時(shí)頻域中,含噪語音最重要的局部特性就是時(shí)頻單元之間的相關(guān)性[14]。在傳統(tǒng)的語音增強(qiáng)方法中,基于含噪語音中的時(shí)頻相關(guān)性,一般通過進(jìn)行時(shí)域和頻域的平滑來計(jì)算含噪語音的局部特征[15];而在基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法中,為了充分利用含噪語音中的時(shí)頻相關(guān)性來提取局部特征,已有方法往往是通過采用與語音識(shí)別相同的對稱窗形式的輸入來實(shí)現(xiàn)的,這種非因果形式的輸入對于具有更高實(shí)時(shí)性要求的語音增強(qiáng)來說,顯然是不合適的。

        在保證因果性的前提下,為了能夠更加充分地利用含噪語音中的時(shí)頻相關(guān)性來提高網(wǎng)絡(luò)的語音增強(qiáng)性能,筆者借鑒傳統(tǒng)語音增強(qiáng)方法中對于含噪語音局部特征的計(jì)算方法,在時(shí)間和頻率兩個(gè)維度采用兩種不同的網(wǎng)絡(luò)結(jié)構(gòu)實(shí)現(xiàn)類似改進(jìn)的最小控制遞歸平均中的時(shí)頻平滑處理[15],設(shè)計(jì)一種更加適用于語音增強(qiáng)的時(shí)頻平滑網(wǎng)絡(luò)結(jié)構(gòu),并提出一種基于該網(wǎng)絡(luò)的語音增強(qiáng)方法,最后通過語音增強(qiáng)實(shí)驗(yàn)對其性能進(jìn)行客觀評價(jià)。

        1 基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)

        將基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)作為一個(gè)回歸問題進(jìn)行解決,通過進(jìn)行網(wǎng)絡(luò)的訓(xùn)練,得到一個(gè)參數(shù)集合θ,從而構(gòu)造含噪語音幀和增強(qiáng)語音幀之間的非線性映射函數(shù)fθ。網(wǎng)絡(luò)的訓(xùn)練通常使用如下的均方誤差代價(jià)函數(shù):

        (1)

        其中,Pl是網(wǎng)絡(luò)的輸入,Tl是網(wǎng)絡(luò)的訓(xùn)練目標(biāo),M是網(wǎng)絡(luò)訓(xùn)練時(shí)采用的Mini-batch。為了保證語音增強(qiáng)系統(tǒng)的因果性,只使用l幀的特征作為對第l幀進(jìn)行語音增強(qiáng)時(shí)的網(wǎng)絡(luò)輸入,即

        Pl=log(|Yl|2) ,

        (2)

        其中,|Yl|2是通過短時(shí)傅里葉變換計(jì)算得到的含噪語音第l幀的功率譜。

        目前入侵檢測技術(shù)是網(wǎng)絡(luò)安全防御中的一項(xiàng)重要技術(shù),它是一種積極主動(dòng)安全防護(hù)技術(shù)。入侵檢測技術(shù)能夠?qū)?nèi)部入侵、外部入侵和其他類型的病毒入侵進(jìn)行及時(shí)準(zhǔn)確的處理,能夠保證在網(wǎng)絡(luò)系統(tǒng)受到真正的損害之前做出對應(yīng)的處理操作。隨著科技水平的不斷提高與發(fā)展,入侵檢測技術(shù)也在朝著智能化的方向發(fā)展。入侵檢測的主要目的就是發(fā)現(xiàn)惡意的網(wǎng)絡(luò)活動(dòng)并及時(shí)的進(jìn)行處理,保證網(wǎng)絡(luò)能夠正常的運(yùn)行。一旦入侵檢測系統(tǒng)發(fā)現(xiàn)不法網(wǎng)絡(luò)入侵之后就會(huì)及時(shí)采取有效的措施來阻斷入侵,并及時(shí)對不法分子進(jìn)行定位。

        2 時(shí)頻平滑網(wǎng)絡(luò)

        2.1 時(shí)域和頻域平滑

        基于含噪語音相鄰幀和相鄰頻帶之間的相關(guān)性,改進(jìn)的最小控制遞歸平均算法通過在時(shí)間和頻率兩個(gè)維度進(jìn)行平滑處理來計(jì)算含噪語音的局部特征[15]。其中,頻域的平滑是通過一個(gè)歸一化窗來實(shí)現(xiàn)的:

        (3)

        (4)

        進(jìn)一步,通過引入卷積運(yùn)算,式(3)的頻域平滑可以改寫為

        (5)

        這里b可以看成是一個(gè)長度為2ω+1的卷積濾波器,在改進(jìn)的最小控制遞歸平均算法中被設(shè)為一個(gè)固定值。

        由于語音增強(qiáng)在時(shí)間上的因果性,時(shí)域的平滑是通過一階遞歸平均來實(shí)現(xiàn)的:

        (6)

        其中,αs是平滑參數(shù),在改進(jìn)的最小控制遞歸平均算法中同樣被設(shè)為一個(gè)固定的常數(shù)。

        可見,由于語音增強(qiáng)在頻率和時(shí)間兩個(gè)維度上存在的差異,為了計(jì)算含噪語音的局部特征,改進(jìn)的最小控制遞歸平均算法在兩個(gè)維度上采用了不同的平滑方法。

        2.2 時(shí)頻平滑網(wǎng)絡(luò)

        受改進(jìn)的最小控制遞歸平均算法中的含噪語音特征計(jì)算方法啟發(fā),在使用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語音增強(qiáng)時(shí),為了更好地提取含噪語音的局部特征,可以采用具有遞歸特性的循環(huán)神經(jīng)網(wǎng)絡(luò)來對含噪語音進(jìn)行時(shí)間維度上的特征平滑,同時(shí)采用卷積網(wǎng)絡(luò)結(jié)構(gòu)來對含噪語音進(jìn)行頻率維度上的特征平滑,通過采用兩種不同結(jié)構(gòu)的網(wǎng)絡(luò)在時(shí)間和頻率兩個(gè)維度上建模,實(shí)現(xiàn)類似改進(jìn)的最小控制遞歸平均算法中的基于時(shí)頻平滑的特征計(jì)算。

        傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)受限于梯度消失問題,無法對含噪語音在時(shí)間維度上的長期依賴關(guān)系進(jìn)行建模;而長短時(shí)記憶網(wǎng)絡(luò)和門控循環(huán)單元(Gated Recurrent Unit,GRU)由于采用了門控機(jī)制,能夠有效地緩解梯度消失問題,更適合用來對含噪語音在時(shí)間上的相關(guān)性進(jìn)行建模。由于門控循環(huán)單元相比長短時(shí)記憶網(wǎng)絡(luò)性能相近但結(jié)構(gòu)更加簡單,因此筆者以門控循環(huán)單元中的門控機(jī)制和遞歸結(jié)構(gòu)為基礎(chǔ),構(gòu)造一種能夠同時(shí)在時(shí)間和頻率兩個(gè)維度上進(jìn)行含噪語音特征平滑的時(shí)頻平滑網(wǎng)絡(luò)(Time-Frequency Smoothing Network,TFSN)。

        在頻率維度上,與門控循環(huán)單元中門控單元的計(jì)算方法不同,時(shí)頻平滑網(wǎng)絡(luò)通過對輸入進(jìn)行卷積來計(jì)算更新門和重置門:

        Zl=σ(WZ*Hl-1+UZ*Xl+bZ) ,

        (7)

        Rl=σ(WR*Hl-1+UR*Xl+bR) ,

        (8)

        其中,“*”表示卷積運(yùn)算,WZ、WR、UZ、UR分別表示相應(yīng)的卷積濾波器,bZ、bR分別表示相應(yīng)的偏置項(xiàng),σ表示Sigmoid激活函數(shù)。

        同樣,單元狀態(tài)的更新也是通過對輸入進(jìn)行卷積運(yùn)算得到的

        (9)

        在時(shí)間維度上,時(shí)頻平滑網(wǎng)絡(luò)的基本單元間的時(shí)序關(guān)系與門控循環(huán)單元一致,是由更新門控制的遞歸過程:

        (10)

        對比式(6)與式(10),可知,時(shí)頻平滑網(wǎng)絡(luò)采用由頻域特征計(jì)算得到的平滑參數(shù)代替式(6)中的αs,實(shí)現(xiàn)了類似改進(jìn)的最小控制遞歸平均算法的時(shí)域平滑。

        3 基于時(shí)頻平滑網(wǎng)絡(luò)的語音增強(qiáng)

        圖1 基于時(shí)頻平滑網(wǎng)絡(luò)的語音增強(qiáng)方法框圖

        為了利用時(shí)頻平滑網(wǎng)絡(luò)進(jìn)行語音增強(qiáng),設(shè)計(jì)了具有3層結(jié)構(gòu)的時(shí)頻平滑深度神經(jīng)網(wǎng)絡(luò),網(wǎng)絡(luò)的各層均為卷積濾波器個(gè)數(shù)為64的時(shí)頻平滑網(wǎng)絡(luò)基本單元,卷積濾波器的長度均為9,如圖1所示。在進(jìn)行模型訓(xùn)練時(shí),以最小化公式(1)中的代價(jià)函數(shù)C(θ)為訓(xùn)練目標(biāo),以含噪語音和相應(yīng)純凈語音的對數(shù)功率譜分別作為網(wǎng)絡(luò)的輸入和輸出。為了保持訓(xùn)練過程的穩(wěn)定,輸入和輸出均進(jìn)行均值方差歸一化處理;在語音增強(qiáng)時(shí),將歸一化處理后的含噪語音對數(shù)功率譜輸入到訓(xùn)練好的網(wǎng)絡(luò)中,網(wǎng)絡(luò)的輸出即為增強(qiáng)語音的對數(shù)功率譜。

        4 實(shí)驗(yàn)與結(jié)果分析

        4.1 訓(xùn)練集與測試集

        為了構(gòu)造包括含噪語音和相應(yīng)純凈語音的訓(xùn)練集,采用TIMIT語音庫的訓(xùn)練集作為純凈語音數(shù)據(jù)的來源[16],采用文獻(xiàn)[17]中的100類真實(shí)噪聲作為噪聲數(shù)據(jù)的來源。訓(xùn)練集的合成方法如下:首先,從純凈語音數(shù)據(jù)中隨機(jī)選取一段語音,并從噪聲數(shù)據(jù)中隨機(jī)選取一段噪聲;其次,將語音段和噪聲段的采樣頻率均轉(zhuǎn)換為8kHz;然后從-10dB、-5dB、0dB、5dB和10dB五種信噪比中隨機(jī)選擇一種,并按照該信噪比將語音段和噪聲段合成含噪語音;最后,重復(fù)上述過程,得到包含50 000段含噪語音和相應(yīng)純凈語音的訓(xùn)練集。

        為了構(gòu)造測試集,采用TIMIT語音庫的測試集作為純凈語音數(shù)據(jù)的來源,采用Noisex92噪聲庫作為噪聲數(shù)據(jù)的來源[18]。測試集的合成方法如下:首先,從噪聲庫中選擇不同于訓(xùn)練集噪聲的4類未知噪聲,即N1(Factory2)、N2(Buccaneer1)、N3(Destroyer engine)和N4(HF channel);其次,將語音數(shù)據(jù)中的所有語音段和全部噪聲段的采樣頻率均轉(zhuǎn)換為8kHz;然后,按照-7dB、0dB和7dB三種信噪比將192段語音和4類噪聲合成含噪語音(-7dB和7dB是與訓(xùn)練集不同的未知信噪比);最后,得到包含2 304(192×3×4)段含噪語音和相應(yīng)的純凈語音的測試集。

        訓(xùn)練集和測試集中計(jì)算對數(shù)功率譜特征所用的短時(shí)傅里葉變換的幀長均設(shè)為32ms(256點(diǎn)),幀移均設(shè)為16ms(128點(diǎn)),所得的對數(shù)功率譜特征維度為129。

        4.2 評價(jià)指標(biāo)

        通過對測試集中的含噪語音進(jìn)行語音增強(qiáng),并對增強(qiáng)語音進(jìn)行客觀評估來衡量網(wǎng)絡(luò)的語音增強(qiáng)性能。采用的增強(qiáng)語音客觀評價(jià)指標(biāo)包括語音質(zhì)量感知評估(Perceptual Evaluation of Speech Quality,PESQ)[19]和短時(shí)客觀可懂度(Short Time Objective Intelligibility,STOI)[20]。其中語音質(zhì)量感知評估是國際電信聯(lián)盟電信標(biāo)準(zhǔn)化部推薦的語音質(zhì)量評估指標(biāo),其得分在-0.5和4.5之間,得分越高,表示增強(qiáng)語音的質(zhì)量越好;短時(shí)客觀可懂度是語音可懂度的評價(jià)指標(biāo),其得分在0和1之間,得分越高,表示增強(qiáng)語音的可懂度越好。

        4.3 網(wǎng)絡(luò)性能比較

        為了驗(yàn)證時(shí)頻平滑網(wǎng)絡(luò)在語音增強(qiáng)上的有效性,將其與全連接神經(jīng)網(wǎng)絡(luò)和門控循環(huán)單元這兩種常用于語音增強(qiáng)的網(wǎng)絡(luò)進(jìn)行對比。所用的全連接神經(jīng)網(wǎng)絡(luò)和門控循環(huán)單元同樣具有3層結(jié)構(gòu),其中全連接神經(jīng)網(wǎng)絡(luò)每層的隱層節(jié)點(diǎn)數(shù)為1 024,門控循環(huán)單元的Cell維度為512;兩種網(wǎng)絡(luò)的訓(xùn)練同樣使用式(1)中的代價(jià)函數(shù)C(θ),并且為了保持語音增強(qiáng)系統(tǒng)的因果性,兩種網(wǎng)絡(luò)的輸入和輸出同樣是單幀的含噪語音對數(shù)功率譜和相應(yīng)的純凈語音對數(shù)功率譜。

        表1和表2分別給出采用全連接神經(jīng)網(wǎng)絡(luò)、門控循環(huán)單元和時(shí)頻平滑網(wǎng)絡(luò)對訓(xùn)練集含噪語音進(jìn)行處理后,得到的4類噪聲和3種信噪比下增強(qiáng)語音的平均語音質(zhì)量感知評估和平均短時(shí)客觀可懂度,并給出了含噪語音的平均語音質(zhì)量感知評估和平均短時(shí)客觀可懂度作為對比??梢?,首先,在低信噪比噪聲條件下,全連接神經(jīng)網(wǎng)絡(luò)增強(qiáng)后語音的平均語音質(zhì)量感知評估相比含噪語音的更差。在全部的噪聲條件下,全連接神經(jīng)網(wǎng)絡(luò)增強(qiáng)后語音的平均短時(shí)客觀可懂度相比含噪語音的更差。這表明:由于全連接神經(jīng)網(wǎng)絡(luò)缺乏對時(shí)間維度上的序列信息進(jìn)行建模的能力,當(dāng)采用單幀的含噪語音特征作為輸入時(shí),全連接神經(jīng)網(wǎng)絡(luò)無法利用含噪語音相鄰幀間的相關(guān)性,從而不能進(jìn)行有效的語音增強(qiáng)。其次,在所有噪聲條件下,門控循環(huán)單元增強(qiáng)后語音的平均語音質(zhì)量感知評估和平均短時(shí)客觀可懂度相比含噪語音的和全連接神經(jīng)網(wǎng)絡(luò)的均有明顯提高。這表明:門控循環(huán)單元通過對含噪語音中的長期依賴關(guān)系進(jìn)行建模,在對某一幀進(jìn)行語音增強(qiáng)時(shí),能夠充分利用該幀與其之前幀間的相關(guān)性,具有了較好的語音增強(qiáng)性能。最后,在大多數(shù)噪聲條件下,時(shí)頻平滑網(wǎng)絡(luò)增強(qiáng)后語音的平均語音質(zhì)量感知評估和平均短時(shí)客觀可懂度相比門控循環(huán)單元的均有明顯提高。這表明:時(shí)頻平滑網(wǎng)絡(luò)通過同時(shí)進(jìn)行時(shí)間維度和頻率維度上的特征平滑,充分利用了兩個(gè)維度上的相關(guān)性,相比門控循環(huán)單元進(jìn)一步提高了語音增強(qiáng)性能。

        表1 不同網(wǎng)絡(luò)增強(qiáng)語音的平均語音質(zhì)量感知評估

        為了進(jìn)一步對比不同網(wǎng)絡(luò)的語音增強(qiáng)性能,對3種網(wǎng)絡(luò)增強(qiáng)后語音的語譜圖進(jìn)行直觀分析。圖2(a)給出一段含有N3噪聲,信噪比為0 dB的含噪語音的語譜圖;圖2(b)~(d)分別給出了使用全連接神經(jīng)網(wǎng)絡(luò)、門控循環(huán)單元和時(shí)頻平滑網(wǎng)絡(luò)增強(qiáng)后語音的語譜圖;圖2(e)給出了原始純凈語音的語譜圖。通過對比純凈語音的語譜圖可見,全連接神經(jīng)網(wǎng)絡(luò)增強(qiáng)后的語音中仍然包含有大量的殘留噪聲成分,門控循環(huán)單元增強(qiáng)后的語音同樣包含明顯可見的殘留噪聲成分,而時(shí)頻平滑網(wǎng)絡(luò)增強(qiáng)后語音的殘留噪聲成分要明顯少于全連接神經(jīng)網(wǎng)絡(luò)和門控循環(huán)單元的,其語譜圖與純凈語音的語譜圖最為接近,表明時(shí)頻平滑網(wǎng)絡(luò)相比其他兩種網(wǎng)絡(luò)具有更好的語音增強(qiáng)性能,這與客觀評價(jià)的結(jié)果是一致的。

        表2 不同網(wǎng)絡(luò)增強(qiáng)語音的平均短時(shí)客觀可懂度

        圖2 不同網(wǎng)絡(luò)增強(qiáng)語音的語譜圖對比

        另外,由于卷積網(wǎng)絡(luò)結(jié)構(gòu)的參數(shù)共享特性,在上述的3種網(wǎng)絡(luò)結(jié)構(gòu)中,時(shí)頻平滑網(wǎng)絡(luò)的參數(shù)規(guī)模要遠(yuǎn)小于門控循環(huán)單元和全連接神經(jīng)網(wǎng)絡(luò)的。如表3所示,時(shí)頻平滑網(wǎng)絡(luò)的參數(shù)量大約是門控循環(huán)單元的38.57%,大約是全連接神經(jīng)網(wǎng)絡(luò)的68.64%。

        表3 不同網(wǎng)絡(luò)的參數(shù)規(guī)模比較

        5 總 結(jié)

        借鑒傳統(tǒng)語音增強(qiáng)在時(shí)間和頻率兩個(gè)維度上采用不同的平滑方式來計(jì)算局部特征的方法,筆者在利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語音增強(qiáng)問題的建模時(shí),采用門控循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來進(jìn)行時(shí)域平滑,同時(shí)采用卷積網(wǎng)絡(luò)結(jié)構(gòu)來進(jìn)行頻域平滑,設(shè)計(jì)了一種時(shí)頻平滑網(wǎng)絡(luò)結(jié)構(gòu),并提出了基于時(shí)頻平滑網(wǎng)絡(luò)的語音增強(qiáng)方法。實(shí)驗(yàn)結(jié)果表明,筆者提出的時(shí)頻平滑網(wǎng)絡(luò)相比全連接神經(jīng)網(wǎng)絡(luò)和門控循環(huán)單元,在參數(shù)規(guī)模更小的前提下,明顯提高了增強(qiáng)語音的語音質(zhì)量和可懂度,具有更好的語音增強(qiáng)性能。然而,由于卷積運(yùn)算相比乘積運(yùn)算更為復(fù)雜,筆者所設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)雖然參數(shù)規(guī)模更小,但是運(yùn)算速度并沒有提高。下一步將針對基于深度神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法的處理速度進(jìn)行深入研究。

        猜你喜歡
        時(shí)頻語音卷積
        基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
        魔力語音
        基于MATLAB的語音信號(hào)處理
        電子制作(2019年14期)2019-08-20 05:43:38
        從濾波器理解卷積
        電子制作(2019年11期)2019-07-04 00:34:38
        基于MQ3與MP3的價(jià)廉物美的酒駕語音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        基于傅里葉域卷積表示的目標(biāo)跟蹤算法
        基于時(shí)頻分析的逆合成孔徑雷達(dá)成像技術(shù)
        對采樣數(shù)據(jù)序列進(jìn)行時(shí)頻分解法的改進(jìn)
        一種基于卷積神經(jīng)網(wǎng)絡(luò)的性別識(shí)別方法
        亚欧免费视频一区二区三区| 狠狠人妻久久久久久综合蜜桃| 久久精品国产亚洲av麻豆| 亚洲国产综合人成综合网站| 久久久99精品视频| 国产美女高潮流白浆视频| av无码国产精品色午夜| 欧美人与动牲猛交xxxxbbbb| 91视频爱爱| 日本一区不卡在线观看| 在线免费观看一区二区| 99re8这里有精品热视频免费| 天天综合天天色| 亚洲中文字幕在线精品2021| 精品人妻一区二区三区浪人在线| 777亚洲精品乱码久久久久久| 亚洲区小说区图片区qvod伊| 亚洲素人日韩av中文字幕| 白浆国产精品一区二区| 久久久久人妻精品一区蜜桃| 亚洲AV无码成人网站久久精品| 国内偷拍视频一区二区| 午夜人妻久久久久久久久| 中国老妇女毛茸茸bbwbabes| 国产片三级视频播放| 日本中文字幕乱码中文乱码| 亚洲中文字幕乱码在线视频| 国产自拍av在线观看视频| 国产亚洲精品aaaa片小说| 国产肉体XXXX裸体784大胆| 日本一区二区视频免费在线观看| 美女网站免费观看视频| 蜜桃av噜噜一区二区三区| 亚洲人成网站在线播放小说| 好看的日韩精品视频在线| 日日碰狠狠添天天爽| 欧美国产日本精品一区二区三区| 亚洲福利视频一区二区三区| 国产精品视频一区二区三区不卡| 精品无码一区二区三区爱欲九九 | 国产码欧美日韩高清综合一区|