亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于殘差信號(hào)諧波和的聲門波提取

        2016-03-15 01:05:34師宏慧李昊璇喬曉艷
        測試技術(shù)學(xué)報(bào) 2016年1期
        關(guān)鍵詞:小波變換

        師宏慧, 李昊璇, 喬曉艷

        (山西大學(xué) 物理電子工程學(xué)院, 山西 太原 030006)

        ?

        基于殘差信號(hào)諧波和的聲門波提取

        師宏慧, 李昊璇, 喬曉艷

        (山西大學(xué) 物理電子工程學(xué)院, 山西 太原 030006)

        摘要:為了獲取高自然度和高精度的聲門波, 將殘差信號(hào)諧波和(SRH)應(yīng)用到聲門波的提取算法中. 首先, 設(shè)計(jì)了一種基于小波變換結(jié)合SRH的清濁音判別算法W-SRH; 然后, 提出了一種基于SRH的基音同步迭代自適應(yīng)逆濾波方法SRH-PSIAIF, 提取激勵(lì)源聲門波. 結(jié)果表明采用W-SRH方法對(duì)清濁音的判別準(zhǔn)確率更高, 采用SRH-PSIAIF算法提取的聲門波自然度較高. 該研究為情感語音聲門波的分析以及情感語音合成奠定了良好基礎(chǔ).

        關(guān)鍵詞:聲門波; 清濁音判別; 小波變換; 殘差信號(hào)諧波和; PSIAIF

        0引言

        為了獲取高自然度和高精度的聲門波, 需要對(duì)采集到的語音信號(hào)進(jìn)行清濁音地判別, 并去除不必要的無聲段和清音段. 目前, 判別清濁音方法雖然很多, 但判別效果不是很理想. 傳統(tǒng)的判別方法基于短時(shí)能量和短時(shí)平均過零率[1], 但該方法清濁音交疊率很大, 會(huì)造成較多的誤判, 尤其在一些需要精確研究濁音的實(shí)驗(yàn)中, 會(huì)造成一定的損失[2]. 為此, 學(xué)者們做了很多改進(jìn), 譚麗等設(shè)計(jì)了一種基于參數(shù)組合的方法對(duì)語音信號(hào)進(jìn)行清濁音判別[2]; 胡瑛等在小波域上用Teager能量算子對(duì)語音信號(hào)進(jìn)行了清濁音的判別[3]; Thomas Drugman等用SRH算法對(duì)語音信號(hào)進(jìn)行了清濁音判別[4], 使清濁音的判別率得到了較大提高. 然而, 在漢語語音特別是情感語音中, 有的清塞音如“k”無周期性, 短時(shí)能量以及過零率與濁音段無異, 采用小波變換的清濁音判別算法時(shí), 會(huì)將這部分語音判別為濁音, 這種誤判會(huì)使提取的濁音信號(hào)不太純凈, 對(duì)后期的研究造成一定的干擾. SRH算法對(duì)這類清塞音的判別率很高, 因此本文設(shè)計(jì)了一種小波變換結(jié)合SRH的清濁音判別算法即W-SRH, 對(duì)清濁音的判別具有很高的精準(zhǔn)度.

        準(zhǔn)確提取出一段語音中的濁音信號(hào)后, 可以進(jìn)一步獲取濁音信號(hào)的激勵(lì)聲門波. 目前比較常用的獲得聲門波的辦法是逆濾波方法, Wong等提出了最小平方相位聲門逆濾波方法[5], Alku提出了迭代自適應(yīng)逆濾波方法(IAIF), 隨后Alku又提出了基音同步迭代自適應(yīng)逆濾波方法(PSIAIF)[6], 這些方法都可以進(jìn)行聲門波的估計(jì), 其基本思想都是逆濾波. 然而, 這些方法都有不足之處, 最小平方相位聲門逆濾波方法只有在聲門波有比較長的閉合相位時(shí)效果才好, IAIF算法中用線性預(yù)測分析(LPC)對(duì)聲道共振峰進(jìn)行估計(jì)時(shí)會(huì)受到聲源諧波成分的影響, 從而使估計(jì)結(jié)果不準(zhǔn)確[6]. 為了避免這些缺陷, 本文采用PSIAIF算法, 并且在基音同步分析中, 我們采用精確度高并且魯棒性也很強(qiáng)的SRH方法進(jìn)行基音同步標(biāo)注, 實(shí)現(xiàn)了一種基于SRH的基音同步迭代自適應(yīng)算法(SRH-PSIAIF). 實(shí)驗(yàn)結(jié)果表明該算法提取的聲門波自然度較高.

        1算法基本理論

        1.1小波變換分析

        一般濁音的低頻幅度比清音部分的低頻幅度明顯要高很多[3], 利用這個(gè)特征對(duì)清濁音判別的準(zhǔn)確度較高. 采用時(shí)頻分析方法提取語音信號(hào)的低頻成分可以進(jìn)行清濁音的判別, 而小波變換是一種很好的時(shí)頻分析方法, 它具有多分辨率、 多尺度的特點(diǎn). 小波變換定義為:

        (1)

        時(shí), 稱ψ(t)為一個(gè)基本小波或母小波. 將母函數(shù)ψ(t)經(jīng)伸縮和平移后得

        (2)

        式中:a為伸縮因子;b為平移因子. 對(duì)于任意信號(hào)f(t)∈L2(R)的連續(xù)小波, 可變換為

        (3)

        連續(xù)小波逆變換公式為

        (4)

        在本實(shí)驗(yàn)中, 需要計(jì)算小波變換后低頻重構(gòu)信號(hào)的短時(shí)能量, 短時(shí)能量定義為

        (5)

        式中:En表示在信號(hào)的第n個(gè)點(diǎn)開始加窗函數(shù)時(shí)的短時(shí)能量;x(n)是重構(gòu)信號(hào);w(n)是窗函數(shù);N為窗長.

        1.2逆濾波原理

        如圖 1 所示, 語音信號(hào)的產(chǎn)生模型包括3個(gè)部分:激勵(lì)源模型、 聲道模型和輻射模型[7]. 根據(jù)這個(gè)模型, 語音信號(hào)S(t)的Z變換S(z)可以用一個(gè)統(tǒng)一的公式來計(jì)算, 即

        (6)

        在濁音的情況下,E(z)是一周期沖擊序列的Z變換, 且A=AV,H(z)=G(z)V(z)R(z); 在清音的情況下,E(z)則是一個(gè)隨機(jī)噪聲的Z變換, 且A=Au,H(z)=V(z)R(z).

        圖 1 語音信號(hào)產(chǎn)生模型Fig.1 The model of speech signal

        逆濾波可以看作是語音產(chǎn)生的逆過程, 設(shè)計(jì)一個(gè)傳輸函數(shù)等于聲道濾波器倒數(shù)的逆濾波器, 然后用該濾波器對(duì)語音信號(hào)進(jìn)行濾波, 即在語音信號(hào)中消除聲道的影響, 最終得到聲源信號(hào)的估計(jì). 通常進(jìn)行逆濾波處理的語音信號(hào)可以是口腔氣流信號(hào), 也可以是語音聲壓信號(hào), 兩者的區(qū)別在于口腔氣流信號(hào)沒有唇輻射的影響, 而聲壓信號(hào)是經(jīng)過唇輻射后的信號(hào), 唇輻射相當(dāng)于一個(gè)一階微分濾波器, 所以, 兩者經(jīng)過逆濾波后分別得到聲門波和聲門波的微分波形[8]. 影響逆濾波后聲門波質(zhì)量的因素主要是共振峰波紋, 這是因?yàn)闆]有將聲道共振峰完全濾除. 從波形上, 理想的聲門波比較平滑, 沒有波紋, 而質(zhì)量不好的聲門波有共振峰波紋.

        1.3殘差信號(hào)諧波和(SRH)

        SRH算法依賴于分析語音信號(hào)的殘差信號(hào), 首先從語音信號(hào)的頻譜包絡(luò)中估計(jì)出聲道模型的自回歸模型, 殘差信號(hào)可以將語音信號(hào)從傳輸函數(shù)為聲道模型倒數(shù)的濾波器逆濾波得到. 對(duì)得到的殘差信號(hào)e(n)進(jìn)行傅里葉變換即可得到殘差信號(hào)的頻譜E(f). 對(duì)于每個(gè)范圍在[F0,min,F0,max]的基頻F0,SRH可以由式(7)計(jì)算[4]

        (7)

        2算法仿真實(shí)現(xiàn)

        2.1W-SRH清濁音判別算法實(shí)現(xiàn)

        圖 2 W-SRH算法實(shí)現(xiàn)框圖Fig.2 Implementation block diagram of W-SRH algorithm

        清濁音的判別算法實(shí)現(xiàn)框圖如圖 2 所示, 其實(shí)現(xiàn)步驟如下:

        1) 采集語音信號(hào)并對(duì)采集到的信號(hào)進(jìn)行預(yù)處理, 包括消噪、 預(yù)加重、 分幀和加窗等;

        2) 對(duì)預(yù)處理信號(hào)進(jìn)行小波分解, 并用低頻系數(shù)對(duì)信號(hào)進(jìn)行重構(gòu), 將重構(gòu)的信號(hào)分幀加窗, 并根據(jù)式(5)計(jì)算每幀重構(gòu)信號(hào)的短時(shí)能量En, 設(shè)置一個(gè)閾值T1, 當(dāng)En

        3) 對(duì)2)中得到的濁音信號(hào)分幀加窗, 并根據(jù)式(7) 計(jì)算每幀信號(hào)的諧波能量和Wn, 設(shè)置一個(gè)閾值T2, 當(dāng)Wn

        2.2SRH-PSIAIF算法實(shí)現(xiàn)

        2.2.1迭代自適應(yīng)逆濾波(IAIF)算法

        迭代自適應(yīng)逆濾波(IAIF)算法的基本思想是從原始語音的頻譜中消除聲門激勵(lì)的影響[7], 然后通過線性預(yù)測的方法(LPC)精確估計(jì)出聲道的模型, 最后通過逆濾波得到聲門波信號(hào). 這個(gè)算法的精髓就是對(duì)聲門激勵(lì)的估計(jì)和對(duì)聲道傳輸函數(shù)的估計(jì)都進(jìn)行了兩次[10], 使得到的聲門波更加精確, 具體實(shí)現(xiàn)流程如圖 3 所示, 其中E1,E2是聲門波LPC參數(shù)估計(jì),H1,H2是聲道LPC參數(shù)估計(jì).

        2.2.2 SRH-PSIAIF

        圖 4 SRH-PSIAIF算法實(shí)現(xiàn)框圖Fig.4 Implementation block diagram of SRH-PSIAIF algorithm

        SRH-PSIAIF的算法流程圖如圖 4 所示. 首先, 將采集到的信號(hào)進(jìn)行高通濾波, 將濾波后的信號(hào)輸入到IAIF-1模塊中可以得到聲源信號(hào)g(n), 用SRH算法對(duì)聲源信號(hào)g(n)進(jìn)行基頻檢測得到語音信號(hào)的基音周期長度值M; 然后, 在聲源信號(hào)g(n)上選取聲門脈沖的峰值作為基音同步位置, 位置提取規(guī)則:Ni為[Ni-1+0.5M,Ni-1+1.5M]區(qū)間中聲源信號(hào)g(n)波形幅度最大的時(shí)刻; 最后, 根據(jù)基音同步位置對(duì)高通濾波后的信號(hào)選擇基音整數(shù)倍的信號(hào)輸入到IAIF-2模塊, 該模塊的輸出為對(duì)聲源信號(hào)的最終估計(jì)[6].

        3結(jié)果與分析

        3.1清濁音判別結(jié)果

        在本次實(shí)驗(yàn)中, 以“孫英開飛機(jī)”這句語音為例進(jìn)行清濁音地判別, 這句語音以16 kHz采樣、 16 bits 量化, 判別出的濁音信號(hào)值為1, 清音信號(hào)和無聲段值為0. 實(shí)驗(yàn)中以20 ms為一幀, 幀疊為10 ms, 分別采用小波變換分析、 SRH算法和W-SRH算法對(duì)這句語音進(jìn)行清濁音判別, 實(shí)驗(yàn)結(jié)果如圖 5 所示, (a)為“孫英開飛機(jī)”時(shí)域圖, (b)為小波變換判別結(jié)果, (c)為SRH判別結(jié)果, (d)為W-SRH判別結(jié)果.

        圖 5 清濁音判別結(jié)果Fig.5 Voice/unvoiced determination result

        由圖 5 可以看出, 小波變換分析算法可以很精確提取出濁音信號(hào), 但對(duì)一些清塞音的判別結(jié)果卻不是很理想, 如“孫英開飛機(jī)”中的“k”這個(gè)音, 小波變換分析算法將它誤判為濁音, 這是因?yàn)樵跐h語語音的清塞音中有很大的低頻成分, 所以會(huì)被誤判. 相對(duì)而言, SRH算法可以很精確的去除清音, 包括不易判別的清塞音, 但在幀長較短的情況下, 會(huì)將部分濁音誤判為清音, 幀長較長的時(shí)候可以很好的判別出濁音, 但部分清音(不包括清塞音)也被判別為濁音. 由此可以看出, 單獨(dú)使用這兩種算法得到的結(jié)果并不理想, 而我們設(shè)計(jì)的W-SRH算法充分結(jié)合了這兩種算法的優(yōu)點(diǎn), 能夠精確的將清濁音分開. 在W-SRH算法中, 小波變換使用較短的幀長, 閾值設(shè)置為5, 而SRH算法使用較長的幀(30 ms~40 ms), 閾值設(shè)置為0.075.

        圖 6 聲門波提取結(jié)果Fig.6 The glottal waveform extraction result

        3.2聲門波提取結(jié)果

        在本實(shí)驗(yàn)中, 采用的是語音聲壓信號(hào), 根據(jù)SRH-PSIAIF算法, 對(duì)提取出的濁音信號(hào)進(jìn)行逆濾波得到聲門波, 聲門波經(jīng)過一階微分即可得到聲門波微分波形. 采用8 kHz采樣的語音信號(hào)進(jìn)行聲門波地提取, 根據(jù)語音編碼標(biāo)準(zhǔn)算法中線性預(yù)測模型的階數(shù)來確定逆濾波的階數(shù), 對(duì)于8 kHz采樣的語音信號(hào), 選用10到12階的濾波器進(jìn)行LPC估計(jì). 根據(jù)大量的實(shí)驗(yàn)發(fā)現(xiàn), 采用10階濾波器對(duì)聲道參數(shù)進(jìn)行估計(jì)效果最佳. 對(duì)聲門波以及聲門微分波形的提取結(jié)果如圖 6 所示.

        如圖 6 中(a)是一幀語音信號(hào)的時(shí)域圖, (b)是這幀語音的聲門波提取結(jié)果, (c)是這幀語音的聲門波微分波形. 由圖可以看出:用SRH-PSIAIF提取出的聲門波波形很平滑, 沒有波紋, 說明能夠有效將聲道共振峰濾除完全, 聲門波自然度較高.

        4結(jié)論

        本文設(shè)計(jì)了一種小波變換結(jié)合SRH的清濁音判別算法W-SRH, 實(shí)驗(yàn)結(jié)果表明其比直接采用小波變換或者SRH算法進(jìn)行清濁音的判別效果要好. 此外, 還設(shè)計(jì)了基于SRH的基音同步迭代自適應(yīng)逆濾波算法SRH-PSIAIF, 用此方法逆濾波得到的聲門激勵(lì)源很自然, 有效克服了LPC分析的缺陷, 為后期情感語音聲門源參數(shù)的提取以及情感語音合成奠定了較好基礎(chǔ).

        參考文獻(xiàn):

        [1]郭英, 李雪嬌, 李宏偉. 一種組合參數(shù)的語音信號(hào)清/濁音判決方法[J]. 空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版), 2002, 3(4): 18-20.

        Guo Ying, Li Xuejiao, Li Hongwei. A simple method of unvoiced/voiced classification of speech signal[J].Journal of Air Force Engineering University(Natural Science Edition), 2002, 3(4): 18-20.(in Chinese)

        [2]譚麗, 胡雙紅. 語音通信中信號(hào)的清濁音判別[J]. 電腦與信息技術(shù), 2010, 18(1): 33-34.

        Tan Li, Hu Shuanghong. The voice/unvoiced decision in speech communication[J]. Computer and Information Technology, 2010, 18(1): 33-34. (in Chinese)

        [3]胡瑛, 陳寧. 基于小波變換的清濁音分類及基音周期檢測算法[J]. 電子與信息學(xué)報(bào), 2008, 30(2): 353-355.

        Hu Ying, Chen Ning. Voice/unvoiced classification and pitch period detection algorithm based on wavelet transform[J]. Journal of Electronics & Information Technology, 2008, 30(2): 353-355. (in Chinese)

        [4] Thomas D, Abeer A. Joint robust voicing detection and pitch estimation based on residual harmonics[C]. Proceedings of the Annual Conference of the International Speech Communication Association.INTERSPEECH 2011-12th Annual Conference of the International Speech Communication Association, 2011: 1973-1976.

        [5]Wong D, Markel J D, Gray A H. Least squares glottal inverse filtering from the acoustic speech waveform[J]. IEEE Trans. Acoustics, Speech, and Signal Processing, 1979, 27(4): 350-355.

        [6]Alku P. Glottal wave analysis with pitch synchronous iterative adaptive inverse filtering[J]. Speech Communication, 1992, 11(2/3): 109-118.

        [7]韓紀(jì)慶, 張磊, 鄭鐵然. 語音信號(hào)處理[M]. 北京: 清華大學(xué)出版社, 2013.

        [8]Cobl C.The voice source in speech communication production and perception experiments involving inverse filtering and synthesis[D].Stockholm:Department of speech,Music and Hearing, KTH, 2003.

        [9]Edwards J A, Angus J A S. Using phase-plane plots to assess glottal inverse filtering[J]. Electronics Letters, 1996, 32(3): 192-193.

        [10]胡瓊, 趙春宇. 利用逆濾波和相平面獲取高自然聲門波的研究[J]. 語音技術(shù), 2011, 35(5): 59-63.

        Hu Qiong, Zhao Chunyu. Study of improving the quality of glottal flow using inverse filtering and phase plane[J].Voice Technology, 2011, 35(5): 59-63. (in Chinese)

        Extraction of the Glottal Waveform Based on the Summation of the Residual Harmonics

        SHI Honghui, LI Haoxuan, QIAO Xiaoyan

        (College of Physics and Electronic Engineering, Shanxi University, Taiyuan 030006, China)

        Abstract:Aiming for fetching more natural and accurate glottal waveform, the summation of the residual harmonics (SRH) algorithm was applied to extract the glottal excitation signal. Firstly, a voice/unvoiced determination algorithm, W-SRH, which combines the wavelet transform analysis and the SRH, was designed. Subsequently, the combined SRH and the pitch synchronization iterative adaptive inverse filtering method (SRH-PSIAIF) approach was utilized to extract the voiced glottal waveform. The experimental results show that, the W-SRH algorithm has a more accurate rate for identifying voice/unvoiced segments, also the extracted glottal excitation by the SRH-PSIAIF technique is sufficiently natural which could contribute to the work for glottal source based emotional speech analysis and synthesis.

        Key words:glottal waveform; voice/unvoiced determination; wavelet transform; SRH; PSIAIF

        中圖分類號(hào):TN912

        文獻(xiàn)標(biāo)識(shí)碼:A

        doi:10.3969/j.issn.1671-7449.2016.01.015

        作者簡介:師宏慧(1991-), 女, 碩士生, 主要從事語音信號(hào)檢測與處理的研究.

        收稿日期:2015-09-24
        基金資助: 山西省回國留學(xué)人員科研資助項(xiàng)目(2014-010); 山西省自然科學(xué)基金資助項(xiàng)目(2013011016-2)

        文章編號(hào):1671-7449(2016)01-0080-06

        猜你喜歡
        小波變換
        最優(yōu)小波包變換在齒輪箱振動(dòng)信號(hào)去噪中的應(yīng)用研究
        負(fù)壓波法管道泄漏監(jiān)測定位系統(tǒng)實(shí)踐與探索
        卷宗(2016年10期)2017-01-21 15:48:38
        基于峰度和小波變換的超短波信號(hào)調(diào)制識(shí)別
        基于雙樹四元數(shù)小波變換的圖像降噪增強(qiáng)
        MATLAB在《數(shù)字圖像處理》課程中的輔助教學(xué)
        基于互信息和小波變換的圖像配準(zhǔn)的研究
        保持細(xì)節(jié)的Retinex紅外圖像增強(qiáng)算法
        基于小波變換的數(shù)字水印技術(shù)
        考試周刊(2016年45期)2016-06-24 13:55:17
        基于Matlab的遙感圖像IHS小波融合算法的并行化設(shè)計(jì)
        科技視界(2016年11期)2016-05-23 08:13:35
        基于小波包絡(luò)分析的滾動(dòng)軸承典型故障診斷技術(shù)研究
        商情(2016年11期)2016-04-15 07:39:54
        色偷偷激情日本亚洲一区二区| 加勒比日本东京热1区| 青青草原亚洲在线视频| 亚洲综合中文字幕日韩| 337p日本欧洲亚洲大胆| 日本亚洲国产一区二区三区| 国产自精品在线| 日韩av一区二区三区精品久久 | 中文字幕一区二区人妻秘书| 午夜色大片在线观看| 五月激情婷婷丁香| 国产在线视频网站不卡| 白白发在线视频免费观看2| 50岁退休熟女露脸高潮| 欧美深夜福利网站在线观看| 亚洲免费av第一区第二区| 狠狠躁夜夜躁av网站中文字幕 | 亚洲自偷自拍另类第1页| 精品亚洲欧美无人区乱码| 2020久久精品亚洲热综合一本| 亚洲天码一区二区三区| 久久综合亚洲色一区二区三区| 人与嘼av免费| 日本女优在线观看一区二区三区| 亚洲一区二区三区偷拍女 | 亚洲啪啪AⅤ一区二区三区| 久久96日本精品久久久| 九九热线有精品视频86| 久久久久中文字幕精品无码免费| 日本女优中文字幕有码| 亚洲欧美综合精品成人网站| 最近中文字幕完整版| 东京热加勒比日韩精品| 少妇人妻中文久久综合| 最新高清无码专区| 青春草在线视频精品| 一区二区三区亚洲视频| 亚洲av日韩精品久久久久久久| 国产午夜亚洲精品理论片不卡| 日产一区一区三区区别| 97se亚洲国产综合在线|