亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于深度學(xué)習(xí)的單音源語音分離方法研究

        2022-06-15 02:33:00
        電聲技術(shù) 2022年4期
        關(guān)鍵詞:解碼器時域編碼器

        陳 瑤

        (西京學(xué)院,陜西 西安 710123)

        0 引言

        在日常交流生活環(huán)境中,語音傳遞多數(shù)伴隨著多方面的噪聲,但人耳可利用聽到的混合語音,經(jīng)過大腦皮層篩選,得到所需信息,即從噪聲中分離得到目標(biāo)語音信息,這種現(xiàn)象稱為“雞尾酒會效應(yīng)”[1]。早間,學(xué)術(shù)界對語音交互的方法研究不深,實(shí)驗(yàn)結(jié)果在相位、語音的質(zhì)量以及計算頻譜圖時間等方面都存在著較大的誤差,因此有必要提高語音分離的質(zhì)量,促進(jìn)交互技術(shù)的發(fā)展,為生活帶來便利。

        1 算法框架

        語音分離技術(shù)通常使用頻域網(wǎng)絡(luò)進(jìn)行處理,時域分離網(wǎng)絡(luò)近幾年才被提出并實(shí)驗(yàn)。時域分離網(wǎng)絡(luò)可以有效地減小相位差,用特征提取替代短時傅里葉變換,滿足時間與頻率局部化的變化,直接對源波形處理?;谇捌趯Ψ椒ǖ恼{(diào)研,本文選擇使用一種全卷積時域分離網(wǎng)絡(luò)。這是一種端到端的深度學(xué)習(xí)方法,由時頻分解、特征提取、目標(biāo)分離、模型訓(xùn)練及波形合成五個模塊組成[2]。

        全卷積時域分離網(wǎng)絡(luò)主要包括編碼、分離及解碼三個處理階段。首先,使用編碼器將兩段波形片段混合;其次將混合后的波形片段轉(zhuǎn)換為特征空間中的相應(yīng)片段[3],并估量每個時間步長中源的乘法函數(shù);最后用解碼器對被掩碼的編碼器特征進(jìn)行變換從而重構(gòu)波形。整個流程如圖1 所示。

        圖1 全卷積分離圖

        全卷積分離網(wǎng)絡(luò)由多個一維卷積塊組成。在建模中,使用時序卷積網(wǎng)絡(luò)(Temporal Convolutional Network,TCN)替代循環(huán)神經(jīng)網(wǎng)絡(luò)(Rerrent Neural Network,RNN),使訓(xùn)練、驗(yàn)證的速度加快。TCN中的每一層都包含呈指數(shù)增長的一維卷積的擴(kuò)展因子。時域分離方法的性能與編碼器窗口大小有關(guān),窗口越小,得到的精度越高,分離模塊需要處理向量的長度也就越長。

        1.1 卷積分離模塊

        本次實(shí)驗(yàn)使用兩段純凈語音合成作為混合語音。假設(shè)有2 位說話人的語音為x1(t),x2(t),y(t)為混合語音,x1(t)為目標(biāo)語音,x2(t)為噪聲。定義如下:

        混合后,將語音分成n段長度為1 的重疊長度語音,sk=1,2,…,n∈D1×1,k為分段索引。經(jīng)一維卷積運(yùn)算將sk轉(zhuǎn)化為M維,再通矩陣乘法重構(gòu):

        式中:U∈Dn×X包含n個向量(編碼器基函數(shù)),每個向量的長度為X,H是一個可選的非線性函數(shù)(非負(fù)數(shù))。第一個轉(zhuǎn)化模塊后,加入非線性激活函數(shù)和歸一化運(yùn)算。

        1.2 編/解碼器

        卷積神經(jīng)網(wǎng)絡(luò)包含了編碼器和解碼器。在編碼時,輸入一段語音信號y(t),通過多層卷積處理并且在每一層中輸入一個帶有參數(shù)的線性整流函數(shù)(PReLU)。

        式中:c為輸入特征,fE(*)是輸入特征中帶向量c的映射函數(shù)。

        解碼時,解碼器即是卷積運(yùn)算的逆操作。其中,xd(t)是說話人的分離信號fD(*)的解碼器的映射函數(shù)。z是噪聲向量,服從正態(tài)分布。計算如下:

        并用一維轉(zhuǎn)置卷積重構(gòu)波形,并表示為一個矩陣乘法:

        1.3 端到端網(wǎng)絡(luò)

        基于端到端的語音分離,將輸入的語音信號直接使用時域上的原始波形點(diǎn)作為輸入特征,進(jìn)行特征提取[4]。

        2 實(shí)驗(yàn)結(jié)果與分析

        2.1 參數(shù)設(shè)置

        從語料庫中分別提取兩種人的50 個純凈語音,信噪比在-5~5 dB,以最小值生成30 h 的訓(xùn)練集、10 h 的驗(yàn)證集以及5 h 的評估集。再將每個數(shù)據(jù)集裁剪成10 小段。波形均以8 kHz 重新采樣。

        初始學(xué)習(xí)率設(shè)置為10-3,訓(xùn)練后設(shè)為10-8。優(yōu)化器使用Adam。N(自動編碼器中過濾器數(shù)量)=256,L(過濾器長度)=20,B(通道數(shù)和剩余路徑的1×1 轉(zhuǎn)換塊)=256,H(卷積塊中通道數(shù))=512,P(卷積塊中內(nèi)核大?。?3。

        2.2 實(shí)驗(yàn)分析

        為了準(zhǔn)確地評估算法的性能,取信噪比都為5 dB 的音頻并生成頻譜圖,如圖2 所示。圖2(a)表示混合聲音的頻譜,圖2(b)表示分離后目標(biāo)語音頻譜,圖2(c)表示分離后噪聲頻譜。從圖2 可以看出,圖2(a)在1—2 區(qū)域內(nèi),頻譜變換多曲折,而在圖2(b)相同區(qū)域中頻譜變化則有一小段趨于0;圖2(a)的最高頻譜值在0.5~0.6,圖2(c)的最高頻譜值則在0.9~1.0;圖2(b)頻譜的最低值出現(xiàn)在2—3 區(qū)域內(nèi),圖2(c)最低值則在1—2區(qū)域內(nèi)。后面兩個子圖與圖2(a)變化明顯,顯然分離的效果較好。

        圖2 spk1 分離前后的頻譜圖

        2.3 對比實(shí)驗(yàn)

        頻域分離作為語音處理中的重要部分,主要是輸入一段時域語音信號,通過一、二維變換成二維頻域信號[5]。在分解時,把卷積后的時域語音信號輸入到短時傅里葉變換內(nèi),變成瞬時語音信號。代替編/解碼器,重構(gòu)波形,以此得到更加稀疏和結(jié)構(gòu)化的聲學(xué)特征表征。spk2 分離前后的時頻如圖3所示。

        經(jīng)過對比,從圖3 可以明顯看出,用時頻方法分離后的音頻譜圖3(b)和原語音頻譜圖3(a)的波形大體相同,只有小部分波形有變化。圖3(a)最高頻譜值在0.5~0.75,與圖3(b)極其相似,只有圖3(c)中才有較小的變化,其頻譜最高在0.5~0.6。說明分離語音質(zhì)量不好,無法完全分離。因此用時域方法分離后音頻的質(zhì)量要比頻域方法更優(yōu)。

        圖3 spk2 分離前后時頻圖

        3 結(jié)語

        全卷積分離網(wǎng)絡(luò)使用的是時域分離方法,即在時域上使用編碼器-解碼器對信號建模,并在非負(fù)編碼器輸出音源,重構(gòu)波形。該模型計算量小,延遲相對較短,是解決語音分離相對較優(yōu)的方法。在今后的工作中,研究者仍需要克服神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)階段產(chǎn)生噪聲對實(shí)驗(yàn)的偏差。

        猜你喜歡
        解碼器時域編碼器
        科學(xué)解碼器(一)
        科學(xué)解碼器(二)
        科學(xué)解碼器(三)
        線圣AudioQuest 發(fā)布第三代Dragonfly Cobalt藍(lán)蜻蜓解碼器
        基于時域信號的三電平逆變器復(fù)合故障診斷
        基于FPGA的同步機(jī)軸角編碼器
        基于PRBS檢測的8B/IOB編碼器設(shè)計
        基于極大似然準(zhǔn)則與滾動時域估計的自適應(yīng)UKF算法
        基于時域逆濾波的寬帶脈沖聲生成技術(shù)
        JESD204B接口協(xié)議中的8B10B編碼器設(shè)計
        電子器件(2015年5期)2015-12-29 08:42:24
        久久精品女人天堂AV一个| 少妇久久久久久被弄到高潮| 国产无遮挡a片又黄又爽| 亚洲嫩模高清在线视频| 亚洲蜜臀av一区二区三区漫画 | 97丨九色丨国产人妻熟女| 成人久久久久久久久久久| 日韩av在线毛片| 国产午夜在线观看视频| 成熟人妻换xxxx| 水蜜桃无码视频在线观看| 女同av在线观看网站| 情头一男一女高冷男女| 琪琪色原网站在线观看| 欧洲日本一线二线三线区本庄铃| 女同中的p是什么意思| 白色白在线观看免费2| 午夜三级a三级三点在线观看| 亚洲巨乳自拍在线视频| 亚洲AV成人无码天堂| 精品一区二区av在线| 亚洲综合av一区二区三区| 久久久精品3d动漫一区二区三区| 国产目拍亚洲精品二区| 级毛片内射视频| 最近最好的中文字幕2019免费| 欧美综合图区亚洲综合图区| 成人av一区二区三区四区| 久久青青草原精品国产app| 国产一级农村无码| 成在线人免费视频播放| 女同精品一区二区久久| 免费人成视频在线| 免费黄色福利| 亚洲一区二区三区在线最新| 成人精品视频一区二区| 最新国产三级| 亚洲国产线茬精品成av| 免费人成在线观看| 久久久久久av无码免费看大片| 日韩成人精品一区二区三区|