亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于殘差信號(hào)諧波和的聲門波提取

        2016-03-15 01:05:34師宏慧李昊璇喬曉艷
        關(guān)鍵詞:小波變換

        師宏慧, 李昊璇, 喬曉艷

        (山西大學(xué) 物理電子工程學(xué)院, 山西 太原 030006)

        ?

        基于殘差信號(hào)諧波和的聲門波提取

        師宏慧, 李昊璇, 喬曉艷

        (山西大學(xué) 物理電子工程學(xué)院, 山西 太原 030006)

        摘要:為了獲取高自然度和高精度的聲門波, 將殘差信號(hào)諧波和(SRH)應(yīng)用到聲門波的提取算法中. 首先, 設(shè)計(jì)了一種基于小波變換結(jié)合SRH的清濁音判別算法W-SRH; 然后, 提出了一種基于SRH的基音同步迭代自適應(yīng)逆濾波方法SRH-PSIAIF, 提取激勵(lì)源聲門波. 結(jié)果表明采用W-SRH方法對(duì)清濁音的判別準(zhǔn)確率更高, 采用SRH-PSIAIF算法提取的聲門波自然度較高. 該研究為情感語(yǔ)音聲門波的分析以及情感語(yǔ)音合成奠定了良好基礎(chǔ).

        關(guān)鍵詞:聲門波; 清濁音判別; 小波變換; 殘差信號(hào)諧波和; PSIAIF

        0引言

        為了獲取高自然度和高精度的聲門波, 需要對(duì)采集到的語(yǔ)音信號(hào)進(jìn)行清濁音地判別, 并去除不必要的無(wú)聲段和清音段. 目前, 判別清濁音方法雖然很多, 但判別效果不是很理想. 傳統(tǒng)的判別方法基于短時(shí)能量和短時(shí)平均過(guò)零率[1], 但該方法清濁音交疊率很大, 會(huì)造成較多的誤判, 尤其在一些需要精確研究濁音的實(shí)驗(yàn)中, 會(huì)造成一定的損失[2]. 為此, 學(xué)者們做了很多改進(jìn), 譚麗等設(shè)計(jì)了一種基于參數(shù)組合的方法對(duì)語(yǔ)音信號(hào)進(jìn)行清濁音判別[2]; 胡瑛等在小波域上用Teager能量算子對(duì)語(yǔ)音信號(hào)進(jìn)行了清濁音的判別[3]; Thomas Drugman等用SRH算法對(duì)語(yǔ)音信號(hào)進(jìn)行了清濁音判別[4], 使清濁音的判別率得到了較大提高. 然而, 在漢語(yǔ)語(yǔ)音特別是情感語(yǔ)音中, 有的清塞音如“k”無(wú)周期性, 短時(shí)能量以及過(guò)零率與濁音段無(wú)異, 采用小波變換的清濁音判別算法時(shí), 會(huì)將這部分語(yǔ)音判別為濁音, 這種誤判會(huì)使提取的濁音信號(hào)不太純凈, 對(duì)后期的研究造成一定的干擾. SRH算法對(duì)這類清塞音的判別率很高, 因此本文設(shè)計(jì)了一種小波變換結(jié)合SRH的清濁音判別算法即W-SRH, 對(duì)清濁音的判別具有很高的精準(zhǔn)度.

        準(zhǔn)確提取出一段語(yǔ)音中的濁音信號(hào)后, 可以進(jìn)一步獲取濁音信號(hào)的激勵(lì)聲門波. 目前比較常用的獲得聲門波的辦法是逆濾波方法, Wong等提出了最小平方相位聲門逆濾波方法[5], Alku提出了迭代自適應(yīng)逆濾波方法(IAIF), 隨后Alku又提出了基音同步迭代自適應(yīng)逆濾波方法(PSIAIF)[6], 這些方法都可以進(jìn)行聲門波的估計(jì), 其基本思想都是逆濾波. 然而, 這些方法都有不足之處, 最小平方相位聲門逆濾波方法只有在聲門波有比較長(zhǎng)的閉合相位時(shí)效果才好, IAIF算法中用線性預(yù)測(cè)分析(LPC)對(duì)聲道共振峰進(jìn)行估計(jì)時(shí)會(huì)受到聲源諧波成分的影響, 從而使估計(jì)結(jié)果不準(zhǔn)確[6]. 為了避免這些缺陷, 本文采用PSIAIF算法, 并且在基音同步分析中, 我們采用精確度高并且魯棒性也很強(qiáng)的SRH方法進(jìn)行基音同步標(biāo)注, 實(shí)現(xiàn)了一種基于SRH的基音同步迭代自適應(yīng)算法(SRH-PSIAIF). 實(shí)驗(yàn)結(jié)果表明該算法提取的聲門波自然度較高.

        1算法基本理論

        1.1小波變換分析

        一般濁音的低頻幅度比清音部分的低頻幅度明顯要高很多[3], 利用這個(gè)特征對(duì)清濁音判別的準(zhǔn)確度較高. 采用時(shí)頻分析方法提取語(yǔ)音信號(hào)的低頻成分可以進(jìn)行清濁音的判別, 而小波變換是一種很好的時(shí)頻分析方法, 它具有多分辨率、 多尺度的特點(diǎn). 小波變換定義為:

        (1)

        時(shí), 稱ψ(t)為一個(gè)基本小波或母小波. 將母函數(shù)ψ(t)經(jīng)伸縮和平移后得

        (2)

        式中:a為伸縮因子;b為平移因子. 對(duì)于任意信號(hào)f(t)∈L2(R)的連續(xù)小波, 可變換為

        (3)

        連續(xù)小波逆變換公式為

        (4)

        在本實(shí)驗(yàn)中, 需要計(jì)算小波變換后低頻重構(gòu)信號(hào)的短時(shí)能量, 短時(shí)能量定義為

        (5)

        式中:En表示在信號(hào)的第n個(gè)點(diǎn)開(kāi)始加窗函數(shù)時(shí)的短時(shí)能量;x(n)是重構(gòu)信號(hào);w(n)是窗函數(shù);N為窗長(zhǎng).

        1.2逆濾波原理

        如圖 1 所示, 語(yǔ)音信號(hào)的產(chǎn)生模型包括3個(gè)部分:激勵(lì)源模型、 聲道模型和輻射模型[7]. 根據(jù)這個(gè)模型, 語(yǔ)音信號(hào)S(t)的Z變換S(z)可以用一個(gè)統(tǒng)一的公式來(lái)計(jì)算, 即

        (6)

        在濁音的情況下,E(z)是一周期沖擊序列的Z變換, 且A=AV,H(z)=G(z)V(z)R(z); 在清音的情況下,E(z)則是一個(gè)隨機(jī)噪聲的Z變換, 且A=Au,H(z)=V(z)R(z).

        圖 1 語(yǔ)音信號(hào)產(chǎn)生模型Fig.1 The model of speech signal

        逆濾波可以看作是語(yǔ)音產(chǎn)生的逆過(guò)程, 設(shè)計(jì)一個(gè)傳輸函數(shù)等于聲道濾波器倒數(shù)的逆濾波器, 然后用該濾波器對(duì)語(yǔ)音信號(hào)進(jìn)行濾波, 即在語(yǔ)音信號(hào)中消除聲道的影響, 最終得到聲源信號(hào)的估計(jì). 通常進(jìn)行逆濾波處理的語(yǔ)音信號(hào)可以是口腔氣流信號(hào), 也可以是語(yǔ)音聲壓信號(hào), 兩者的區(qū)別在于口腔氣流信號(hào)沒(méi)有唇輻射的影響, 而聲壓信號(hào)是經(jīng)過(guò)唇輻射后的信號(hào), 唇輻射相當(dāng)于一個(gè)一階微分濾波器, 所以, 兩者經(jīng)過(guò)逆濾波后分別得到聲門波和聲門波的微分波形[8]. 影響逆濾波后聲門波質(zhì)量的因素主要是共振峰波紋, 這是因?yàn)闆](méi)有將聲道共振峰完全濾除. 從波形上, 理想的聲門波比較平滑, 沒(méi)有波紋, 而質(zhì)量不好的聲門波有共振峰波紋.

        1.3殘差信號(hào)諧波和(SRH)

        SRH算法依賴于分析語(yǔ)音信號(hào)的殘差信號(hào), 首先從語(yǔ)音信號(hào)的頻譜包絡(luò)中估計(jì)出聲道模型的自回歸模型, 殘差信號(hào)可以將語(yǔ)音信號(hào)從傳輸函數(shù)為聲道模型倒數(shù)的濾波器逆濾波得到. 對(duì)得到的殘差信號(hào)e(n)進(jìn)行傅里葉變換即可得到殘差信號(hào)的頻譜E(f). 對(duì)于每個(gè)范圍在[F0,min,F0,max]的基頻F0,SRH可以由式(7)計(jì)算[4]

        (7)

        2算法仿真實(shí)現(xiàn)

        2.1W-SRH清濁音判別算法實(shí)現(xiàn)

        圖 2 W-SRH算法實(shí)現(xiàn)框圖Fig.2 Implementation block diagram of W-SRH algorithm

        清濁音的判別算法實(shí)現(xiàn)框圖如圖 2 所示, 其實(shí)現(xiàn)步驟如下:

        1) 采集語(yǔ)音信號(hào)并對(duì)采集到的信號(hào)進(jìn)行預(yù)處理, 包括消噪、 預(yù)加重、 分幀和加窗等;

        2) 對(duì)預(yù)處理信號(hào)進(jìn)行小波分解, 并用低頻系數(shù)對(duì)信號(hào)進(jìn)行重構(gòu), 將重構(gòu)的信號(hào)分幀加窗, 并根據(jù)式(5)計(jì)算每幀重構(gòu)信號(hào)的短時(shí)能量En, 設(shè)置一個(gè)閾值T1, 當(dāng)En

        3) 對(duì)2)中得到的濁音信號(hào)分幀加窗, 并根據(jù)式(7) 計(jì)算每幀信號(hào)的諧波能量和Wn, 設(shè)置一個(gè)閾值T2, 當(dāng)Wn

        2.2SRH-PSIAIF算法實(shí)現(xiàn)

        2.2.1迭代自適應(yīng)逆濾波(IAIF)算法

        迭代自適應(yīng)逆濾波(IAIF)算法的基本思想是從原始語(yǔ)音的頻譜中消除聲門激勵(lì)的影響[7], 然后通過(guò)線性預(yù)測(cè)的方法(LPC)精確估計(jì)出聲道的模型, 最后通過(guò)逆濾波得到聲門波信號(hào). 這個(gè)算法的精髓就是對(duì)聲門激勵(lì)的估計(jì)和對(duì)聲道傳輸函數(shù)的估計(jì)都進(jìn)行了兩次[10], 使得到的聲門波更加精確, 具體實(shí)現(xiàn)流程如圖 3 所示, 其中E1,E2是聲門波LPC參數(shù)估計(jì),H1,H2是聲道LPC參數(shù)估計(jì).

        2.2.2 SRH-PSIAIF

        圖 4 SRH-PSIAIF算法實(shí)現(xiàn)框圖Fig.4 Implementation block diagram of SRH-PSIAIF algorithm

        SRH-PSIAIF的算法流程圖如圖 4 所示. 首先, 將采集到的信號(hào)進(jìn)行高通濾波, 將濾波后的信號(hào)輸入到IAIF-1模塊中可以得到聲源信號(hào)g(n), 用SRH算法對(duì)聲源信號(hào)g(n)進(jìn)行基頻檢測(cè)得到語(yǔ)音信號(hào)的基音周期長(zhǎng)度值M; 然后, 在聲源信號(hào)g(n)上選取聲門脈沖的峰值作為基音同步位置, 位置提取規(guī)則:Ni為[Ni-1+0.5M,Ni-1+1.5M]區(qū)間中聲源信號(hào)g(n)波形幅度最大的時(shí)刻; 最后, 根據(jù)基音同步位置對(duì)高通濾波后的信號(hào)選擇基音整數(shù)倍的信號(hào)輸入到IAIF-2模塊, 該模塊的輸出為對(duì)聲源信號(hào)的最終估計(jì)[6].

        3結(jié)果與分析

        3.1清濁音判別結(jié)果

        在本次實(shí)驗(yàn)中, 以“孫英開(kāi)飛機(jī)”這句語(yǔ)音為例進(jìn)行清濁音地判別, 這句語(yǔ)音以16 kHz采樣、 16 bits 量化, 判別出的濁音信號(hào)值為1, 清音信號(hào)和無(wú)聲段值為0. 實(shí)驗(yàn)中以20 ms為一幀, 幀疊為10 ms, 分別采用小波變換分析、 SRH算法和W-SRH算法對(duì)這句語(yǔ)音進(jìn)行清濁音判別, 實(shí)驗(yàn)結(jié)果如圖 5 所示, (a)為“孫英開(kāi)飛機(jī)”時(shí)域圖, (b)為小波變換判別結(jié)果, (c)為SRH判別結(jié)果, (d)為W-SRH判別結(jié)果.

        圖 5 清濁音判別結(jié)果Fig.5 Voice/unvoiced determination result

        由圖 5 可以看出, 小波變換分析算法可以很精確提取出濁音信號(hào), 但對(duì)一些清塞音的判別結(jié)果卻不是很理想, 如“孫英開(kāi)飛機(jī)”中的“k”這個(gè)音, 小波變換分析算法將它誤判為濁音, 這是因?yàn)樵跐h語(yǔ)語(yǔ)音的清塞音中有很大的低頻成分, 所以會(huì)被誤判. 相對(duì)而言, SRH算法可以很精確的去除清音, 包括不易判別的清塞音, 但在幀長(zhǎng)較短的情況下, 會(huì)將部分濁音誤判為清音, 幀長(zhǎng)較長(zhǎng)的時(shí)候可以很好的判別出濁音, 但部分清音(不包括清塞音)也被判別為濁音. 由此可以看出, 單獨(dú)使用這兩種算法得到的結(jié)果并不理想, 而我們?cè)O(shè)計(jì)的W-SRH算法充分結(jié)合了這兩種算法的優(yōu)點(diǎn), 能夠精確的將清濁音分開(kāi). 在W-SRH算法中, 小波變換使用較短的幀長(zhǎng), 閾值設(shè)置為5, 而SRH算法使用較長(zhǎng)的幀(30 ms~40 ms), 閾值設(shè)置為0.075.

        圖 6 聲門波提取結(jié)果Fig.6 The glottal waveform extraction result

        3.2聲門波提取結(jié)果

        在本實(shí)驗(yàn)中, 采用的是語(yǔ)音聲壓信號(hào), 根據(jù)SRH-PSIAIF算法, 對(duì)提取出的濁音信號(hào)進(jìn)行逆濾波得到聲門波, 聲門波經(jīng)過(guò)一階微分即可得到聲門波微分波形. 采用8 kHz采樣的語(yǔ)音信號(hào)進(jìn)行聲門波地提取, 根據(jù)語(yǔ)音編碼標(biāo)準(zhǔn)算法中線性預(yù)測(cè)模型的階數(shù)來(lái)確定逆濾波的階數(shù), 對(duì)于8 kHz采樣的語(yǔ)音信號(hào), 選用10到12階的濾波器進(jìn)行LPC估計(jì). 根據(jù)大量的實(shí)驗(yàn)發(fā)現(xiàn), 采用10階濾波器對(duì)聲道參數(shù)進(jìn)行估計(jì)效果最佳. 對(duì)聲門波以及聲門微分波形的提取結(jié)果如圖 6 所示.

        如圖 6 中(a)是一幀語(yǔ)音信號(hào)的時(shí)域圖, (b)是這幀語(yǔ)音的聲門波提取結(jié)果, (c)是這幀語(yǔ)音的聲門波微分波形. 由圖可以看出:用SRH-PSIAIF提取出的聲門波波形很平滑, 沒(méi)有波紋, 說(shuō)明能夠有效將聲道共振峰濾除完全, 聲門波自然度較高.

        4結(jié)論

        本文設(shè)計(jì)了一種小波變換結(jié)合SRH的清濁音判別算法W-SRH, 實(shí)驗(yàn)結(jié)果表明其比直接采用小波變換或者SRH算法進(jìn)行清濁音的判別效果要好. 此外, 還設(shè)計(jì)了基于SRH的基音同步迭代自適應(yīng)逆濾波算法SRH-PSIAIF, 用此方法逆濾波得到的聲門激勵(lì)源很自然, 有效克服了LPC分析的缺陷, 為后期情感語(yǔ)音聲門源參數(shù)的提取以及情感語(yǔ)音合成奠定了較好基礎(chǔ).

        參考文獻(xiàn):

        [1]郭英, 李雪嬌, 李宏偉. 一種組合參數(shù)的語(yǔ)音信號(hào)清/濁音判決方法[J]. 空軍工程大學(xué)學(xué)報(bào)(自然科學(xué)版), 2002, 3(4): 18-20.

        Guo Ying, Li Xuejiao, Li Hongwei. A simple method of unvoiced/voiced classification of speech signal[J].Journal of Air Force Engineering University(Natural Science Edition), 2002, 3(4): 18-20.(in Chinese)

        [2]譚麗, 胡雙紅. 語(yǔ)音通信中信號(hào)的清濁音判別[J]. 電腦與信息技術(shù), 2010, 18(1): 33-34.

        Tan Li, Hu Shuanghong. The voice/unvoiced decision in speech communication[J]. Computer and Information Technology, 2010, 18(1): 33-34. (in Chinese)

        [3]胡瑛, 陳寧. 基于小波變換的清濁音分類及基音周期檢測(cè)算法[J]. 電子與信息學(xué)報(bào), 2008, 30(2): 353-355.

        Hu Ying, Chen Ning. Voice/unvoiced classification and pitch period detection algorithm based on wavelet transform[J]. Journal of Electronics & Information Technology, 2008, 30(2): 353-355. (in Chinese)

        [4] Thomas D, Abeer A. Joint robust voicing detection and pitch estimation based on residual harmonics[C]. Proceedings of the Annual Conference of the International Speech Communication Association.INTERSPEECH 2011-12th Annual Conference of the International Speech Communication Association, 2011: 1973-1976.

        [5]Wong D, Markel J D, Gray A H. Least squares glottal inverse filtering from the acoustic speech waveform[J]. IEEE Trans. Acoustics, Speech, and Signal Processing, 1979, 27(4): 350-355.

        [6]Alku P. Glottal wave analysis with pitch synchronous iterative adaptive inverse filtering[J]. Speech Communication, 1992, 11(2/3): 109-118.

        [7]韓紀(jì)慶, 張磊, 鄭鐵然. 語(yǔ)音信號(hào)處理[M]. 北京: 清華大學(xué)出版社, 2013.

        [8]Cobl C.The voice source in speech communication production and perception experiments involving inverse filtering and synthesis[D].Stockholm:Department of speech,Music and Hearing, KTH, 2003.

        [9]Edwards J A, Angus J A S. Using phase-plane plots to assess glottal inverse filtering[J]. Electronics Letters, 1996, 32(3): 192-193.

        [10]胡瓊, 趙春宇. 利用逆濾波和相平面獲取高自然聲門波的研究[J]. 語(yǔ)音技術(shù), 2011, 35(5): 59-63.

        Hu Qiong, Zhao Chunyu. Study of improving the quality of glottal flow using inverse filtering and phase plane[J].Voice Technology, 2011, 35(5): 59-63. (in Chinese)

        Extraction of the Glottal Waveform Based on the Summation of the Residual Harmonics

        SHI Honghui, LI Haoxuan, QIAO Xiaoyan

        (College of Physics and Electronic Engineering, Shanxi University, Taiyuan 030006, China)

        Abstract:Aiming for fetching more natural and accurate glottal waveform, the summation of the residual harmonics (SRH) algorithm was applied to extract the glottal excitation signal. Firstly, a voice/unvoiced determination algorithm, W-SRH, which combines the wavelet transform analysis and the SRH, was designed. Subsequently, the combined SRH and the pitch synchronization iterative adaptive inverse filtering method (SRH-PSIAIF) approach was utilized to extract the voiced glottal waveform. The experimental results show that, the W-SRH algorithm has a more accurate rate for identifying voice/unvoiced segments, also the extracted glottal excitation by the SRH-PSIAIF technique is sufficiently natural which could contribute to the work for glottal source based emotional speech analysis and synthesis.

        Key words:glottal waveform; voice/unvoiced determination; wavelet transform; SRH; PSIAIF

        中圖分類號(hào):TN912

        文獻(xiàn)標(biāo)識(shí)碼:A

        doi:10.3969/j.issn.1671-7449.2016.01.015

        作者簡(jiǎn)介:師宏慧(1991-), 女, 碩士生, 主要從事語(yǔ)音信號(hào)檢測(cè)與處理的研究.

        收稿日期:2015-09-24
        基金資助: 山西省回國(guó)留學(xué)人員科研資助項(xiàng)目(2014-010); 山西省自然科學(xué)基金資助項(xiàng)目(2013011016-2)

        文章編號(hào):1671-7449(2016)01-0080-06

        猜你喜歡
        小波變換
        最優(yōu)小波包變換在齒輪箱振動(dòng)信號(hào)去噪中的應(yīng)用研究
        負(fù)壓波法管道泄漏監(jiān)測(cè)定位系統(tǒng)實(shí)踐與探索
        卷宗(2016年10期)2017-01-21 15:48:38
        基于峰度和小波變換的超短波信號(hào)調(diào)制識(shí)別
        基于雙樹(shù)四元數(shù)小波變換的圖像降噪增強(qiáng)
        MATLAB在《數(shù)字圖像處理》課程中的輔助教學(xué)
        基于互信息和小波變換的圖像配準(zhǔn)的研究
        保持細(xì)節(jié)的Retinex紅外圖像增強(qiáng)算法
        基于小波變換的數(shù)字水印技術(shù)
        考試周刊(2016年45期)2016-06-24 13:55:17
        基于Matlab的遙感圖像IHS小波融合算法的并行化設(shè)計(jì)
        科技視界(2016年11期)2016-05-23 08:13:35
        基于小波包絡(luò)分析的滾動(dòng)軸承典型故障診斷技術(shù)研究
        商情(2016年11期)2016-04-15 07:39:54
        91羞射短视频在线观看| 又爽又黄禁片视频1000免费| 91白浆在线视频| 又爽又猛又大又湿的视频| av在线免费观看网站免费| 国产午夜福利在线观看红一片| 无套内谢孕妇毛片免费看看| 亚洲一区精品中文字幕| 日韩在线不卡一区三区av| 狠狠躁18三区二区一区| 久久精品视频在线看99| 91精品综合久久久久m3u8| 亚洲a级视频在线播放| 国产激情无码视频在线播放性色| 99久久国产露脸精品竹菊传媒| 欧美日韩激情在线一区二区| 日本成人精品一区二区三区| 综合五月激情二区视频| 久久国产精久久精产国| 性无码国产一区在线观看| 午夜免费观看国产视频| 波多野结衣的av一区二区三区| 久久99精品久久久久久久清纯| 久久伊人精品只有这里有| 日韩精品一区二区三区在线视频 | 传媒在线无码| 亚洲高清激情一区二区三区| 奇米影视色777四色在线首页| 一本大道久久香蕉成人网| 少妇bbwbbw高潮| 国产亚洲精品在线视频| 精品久久久久久无码人妻热| 另类欧美亚洲| 国产激情在线观看视频网址| 在线中文字幕乱码英文字幕正常| 中文字幕人妻丝袜美腿乱| 精品国产亚洲av麻豆尤物| 日韩肥臀人妻中文字幕一区| 中文无码久久精品| 亚洲国产精品中文字幕日韩| 青青草视频在线观看绿色|