亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于趨勢分析的AMDF基音檢測改進(jìn)算法

        2014-09-19 05:31:42曾毓敏李鵬程
        振動與沖擊 2014年20期
        關(guān)鍵詞:趨勢信號檢測

        宗 源,曾毓敏,張 夢,李鵬程

        (南京師范大學(xué) 物理科學(xué)與技術(shù)學(xué)院,南京 210023)

        基音作為語音信號處理的重要特征參數(shù),指人在發(fā)濁音時氣流通過聲門使聲帶張弛振蕩的振動頻率(或周期),廣泛用于語音編碼、語音合成、語音增強(qiáng)及語音識別等。因此能準(zhǔn)確檢測基音意義極其重要。經(jīng)典的基音檢測算法有自相關(guān)函數(shù)法[1]、平均幅度差函數(shù) 法 (Average Magnitude Difference Function,AMDF)[2]、倒譜法[3]及小波變換法[4]等。盡管已有諸多算法及其改進(jìn)算法,但準(zhǔn)確、可信的基音檢測算法研究仍為具有挑戰(zhàn)性工作[5]。

        AMDF算法以原理簡單、計算復(fù)雜度低等優(yōu)點(diǎn)得以廣泛使用。由AMDF定義知,周期信號或準(zhǔn)周期信號將在AMDF時延等于信號周期處會產(chǎn)生極小值(谷值點(diǎn))。濁音語音信號因具有準(zhǔn)周期性,因此可通過計算短時窗內(nèi)語音信號的AMDF,并據(jù)AMDF除零點(diǎn)外的最低谷值點(diǎn)估計語音信號基音;但該最低谷值點(diǎn)的選擇受共振峰效應(yīng)、語音信號并不嚴(yán)格的準(zhǔn)周期性、噪聲等諸多因素干擾[6],使AMDF在檢測過程中易發(fā)生倍頻錯誤,即檢測結(jié)果為實(shí)際基音的N倍。分析AMDF發(fā)現(xiàn),隨時延的增加計算AMDF語音幀的重疊部分會逐漸減少,導(dǎo)致AMDF波形呈均值下降趨勢(falling trend)[7],且使AMDF非基音谷值點(diǎn)有時低于實(shí)際基音谷值點(diǎn)而發(fā)生檢測錯誤。

        為克服此下降趨勢,文獻(xiàn)[7]提出改進(jìn)的AMDF函數(shù),稱為 Circular AMDF(CAMDF)。CAMDF通過改變傳統(tǒng)的AMDF計算方法克服均值下降趨勢,檢測效果較好;文獻(xiàn)[8]提出的 Extended AMDF(EAMDF)可補(bǔ)償隨時延增加而減少的語音幀重疊部分達(dá)到去除下降趨勢效果。這些改進(jìn)算法雖能克服均值下降趨勢,但均通過改變AMDF定義或改變語音幀長達(dá)到目的,因此仍會帶來無法預(yù)估的錯誤,并不能從根本上解決均值下降趨勢所致AMDF算法出現(xiàn)倍頻錯誤問題。

        本文由時間序列分析角度對AMDF進(jìn)行分析,提出基于去均值下降趨勢的AMDF基音檢測算法改進(jìn)框架。該框架完全不同于以CAMDF與EAMDF為代表的兩類AMDF改進(jìn)算法,主要將AMDF視為一段時間序列,利用趨勢分析方法提取AMDF序列的均值下降趨勢;將均值下降趨勢從AMDF中減去獲得改進(jìn)的AMDF用于檢測基音。在該改進(jìn)框架下提出以線性趨勢表示AMDF的均值下降趨勢,得到改進(jìn)的AMDF(本文定義為LSAMDF)。仿真實(shí)驗(yàn)結(jié)果表明,LSAMDF能較好克服傳統(tǒng)AMDF的倍頻檢測錯誤,且算法復(fù)雜度較低。

        1 傳統(tǒng)AMDF及改進(jìn)算法分析

        語音信號的短時平均幅度差函數(shù)定義為

        式中:x(n)為加窗長為N的矩形窗濁音語音幀;τ為時延。

        DAMDF(τ)擁有與濁音語音一致的周期特性,并在τ=Fs/Fp處出現(xiàn)最小谷值(除零點(diǎn)外)。其中Fp為基音頻率;Fs為采樣頻率。通過計算DAMDF(τ)找出最小谷值點(diǎn)即能檢測出濁音語音基音頻率;但因?yàn)閤(n)為加窗后的語音幀,窗外語音信號值均為零,故隨時延τ的增加AMDF不能完全顯示濁音語音幀的周期性本質(zhì),而均值變化呈下降趨勢,(見圖1(b),待檢測語音信號見圖1(a),采樣頻率 20 000 Hz,信號長度 512采樣點(diǎn)),由此導(dǎo)致實(shí)際應(yīng)用中會出現(xiàn)表示真正基音點(diǎn)并非最小谷值。由圖1(b)看出,均值下降趨勢會直接影響AMDF性能。

        解決AMDF存在問題有兩種方法:

        (1)修正 AMDF定義:如 LVAMDF[9],CAMDF等。其中CAMDF因性能突出頗受關(guān)注,其定義為

        由式(2)知,CAMDF關(guān)于 τ=N/2對稱。因此CAMDF僅前半部分有效,對基音谷值點(diǎn)落在AMDF后半部分的濁音語音幀,CAMDF不能準(zhǔn)確檢測基音。由于CAMDF已改變AMDF的定義,因此會帶來未知錯誤。圖1(c)為圖1(a)濁音語音幀的 CAMDF,便發(fā)生檢測錯誤。

        (2)改變用于計算AMDF的語音幀長度。EAMDF即為通過將語音幀前后各增加半幀長的語音信號,可補(bǔ)償隨延遲增加而引起重疊部分的減少、克服AMDF下降趨勢。EAMDF定義為

        由式(3)知,實(shí)際的EAMDF計算涉及三個語音幀,即待檢測語音幀及其前后相鄰的兩個語音幀。因此盡管EAMDF能克服AMDF的下降趨勢,但EAMDF并非嚴(yán)格意義的待檢測語音幀的AMDF。而語音幀長度過長也易破壞語音幀的短時平穩(wěn)性,使EAMDF會產(chǎn)生檢測錯誤。由圖1(d)看出,EAMDF亦發(fā)生檢測錯誤。

        圖1 濁音語音信號AMDF、CAMDF、EAMDF,EMDAMDF與LSAMDF的比較Fig.1 Comparison between AMDF,CAMDF,EAMDF,EMDAMDF and LSAMDF on a voiced speech frame

        由時間序列分析觀點(diǎn),AMDF存在的均值下降趨勢即是為時間序列分析中的趨勢問題。趨勢項(xiàng)一直被視為時間序列長時間動向,盡管趨勢項(xiàng)在數(shù)學(xué)上無準(zhǔn)確定義,但一般認(rèn)為趨勢項(xiàng)為測試信號中周期遠(yuǎn)大于信號記錄時間長度成分[10]。宗源等[11]利用經(jīng)驗(yàn)分解模式(Empirical Mode Decomposition,EMD)對 AMDF進(jìn)行分析,發(fā)現(xiàn)殘余分量即為AMDF均值下降趨勢,利用除殘余分量外所有本征模式函數(shù)(Intrinsic Mode Functions,IMFs)重構(gòu)獲得不含均值下降趨勢、改進(jìn)的AMDF(定義為EMDAMDF),且檢測性能較好。在此基礎(chǔ)上及受文獻(xiàn)[12-13]啟發(fā),本文提出改進(jìn)框架克服AMDF均值下降趨勢,能從根本上解決AMDF易發(fā)生倍頻檢測錯誤問題,見圖2。該框架完全有別于以上兩種常見的AMDF改進(jìn)方法框架,主要分均值下降趨勢提取及均值下降趨勢去除兩步。

        由EMDAMDF原理知,EMDAMDF實(shí)際上亦可歸于此改進(jìn)框架內(nèi);但EMD提取AMDF均值下降趨勢需進(jìn)行多次三次樣條擬合及去除上下包絡(luò)均值操作,計算量較大。為改進(jìn)AMDF,圖2的改進(jìn)框架并不需要非常精確獲得AMDF的均值下降趨勢。因此本文提出利用線性多項(xiàng)式表示AMDF的均值下降趨勢。在此基礎(chǔ)上即可通過最小二乘法擬合均值下降趨勢,獲得改進(jìn)的 AMDFLSAMDF(Least squarebased AMDF)。圖 1(f)即為圖1(a)濁音語音幀的 LSAMDF。由圖 1(f)看出,LSAMDF與 EMDAMDF(圖1(e))相同,均能準(zhǔn)確檢測出該濁音語音幀的基音。由此本文給出基于最小二乘法的AMDF基音檢測改進(jìn)算法。

        圖2 基于去均值下降趨勢的AMDF改進(jìn)框架Fig.2 Framework for improving AMDF based on eliminating the falling trend

        2 基于最小二乘法的AMDF改進(jìn)算法

        記一幀濁音語音信號的AMDF為γ,其中時延τ=t1,t2,…,tn(式(1)),令 AMDF對應(yīng)各時延 τ值為D(τ)=γ1,γ2,…,γn。記 AMDF中所有樣本點(diǎn)為(t1,γ1),(t2,γ2),…,(tn,γn)。以線性多項(xiàng)式表示 AMDF均值下降趨勢為

        最小二乘法估計參數(shù)α及β原理為最小化代價函數(shù)

        求解式(5)方法有多種,此處僅給出線性代數(shù)解法。定理[14]為:若A為秩n的m×n矩陣,則正規(guī)方程組 ATAx=ATb有唯一解 x^=(ATA)-1ATb且 x^為方程組Ax=b唯一最小二乘解。將樣本點(diǎn)(t1,γ1),(t2,γ2),…,(tn,γn)代入式(4)得

        綜合以上分析,基于最小二乘法的AMDF基音檢測改進(jìn)算法具體步驟為:① 計算待檢測語音幀的AMDF:γ;② 利用最小二乘法計算AMDF的均值下降趨勢=^+^t;③ 計算 LSAMDF:γLSAMDF=γ-λ^。

        EMD與最小二乘法提取的AMDF(圖1(b))的均值下降趨勢(分別記為 EMDtrend及 LStrend)見圖3。由圖3看出,兩種下降趨勢基本相同,均能較好表示AMDF樣本點(diǎn)的基本動向;但圖3(c)EMD-trend與LS-trend在矩形框內(nèi)部分差異較大,EMD-trend前端呈局部輕微上升趨勢;而EMD可精確捕捉時間序列下降趨勢的局部細(xì)節(jié)變化;但在圖2改進(jìn)框架中提取均值下降趨勢無需十分精確。由于AMDF基音谷值候選點(diǎn)受其前端局部趨勢影響不大;而EMD提取均值下降趨勢需多次三次樣條擬合及去包絡(luò)均值計算,計算量明顯大于最小二乘法擬合線性趨勢。故認(rèn)為LSAMDF綜合性能優(yōu)于EMDAMDF。

        圖3 LS與EMD提取的均值下降趨勢Fig.3 Two falling trends extracted by LSand EMD respectively

        3 仿真實(shí)驗(yàn)與分析

        實(shí)驗(yàn)用基爾基音檢測參考數(shù)據(jù)庫(the Keele Pitch Extraction Reference Database)[15]對各種算法的基音檢測性能進(jìn)行評價。該數(shù)據(jù)庫中所有語音均以20 000 Hz采樣,16 bits量化,并提供以512個采樣點(diǎn)為幀長、200個采樣點(diǎn)為幀移的所有濁音幀參考基音信息。實(shí)驗(yàn)用AMDF、CAMDF、EAMDF、EMDAMDF及 LSAMDF檢測出基爾數(shù)據(jù)庫中編號為M1的男性語音信號前50幀基音軌跡,見圖 4。由圖 4看出,LSAMDF與 CAMDF、EAMDF、EMDAMDF均能較好克服AMDF的不足,檢測性能明顯優(yōu)于AMDF;LSAMDF與EMDAMDF能避免CAMDF與EAMDF的部分錯誤(如第15、40幀)。

        圖4 五種算法分別檢測的語音信號基音軌跡Fig.4 Pitch contrails of a speech signal detected by five algorithms respectively

        為進(jìn)一步驗(yàn)證本文所提基于去均值下降趨勢的AMDF算法改進(jìn)框架及以線性多項(xiàng)式表示均值下降趨勢假設(shè)的正確性及合理性,實(shí)驗(yàn)仍用AMDF、CAMDF、EAMDF、EMDAMDF及 LSAMDF五種算法對 Keele數(shù)據(jù)庫中 5個樣本(編號 F1,F(xiàn)2,F(xiàn)3,M2,M3)進(jìn)行基音檢測。檢測結(jié)果與數(shù)據(jù)庫中參考基音相對誤差大于或等于1 ms(以基音周期計算)定義為基音粗差(Gross Pitch Error,GPE)[16],以%GPE作為指標(biāo)比較各算法。需指出的是,由于基音頻率一般為50~500 Hz,實(shí)驗(yàn)中所有待檢測樣本均進(jìn)行50~500 Hz的帶通濾波。此外無任何預(yù)處理(如半波整流、中心削波等)及后處理(基音平滑等)步驟。

        各種算法對5個樣本進(jìn)行檢測的%GPE見表1。由表 1看出,CAMDF、EAMDF、EMDAMDF及 LSAMDF的%GPE均明顯低于傳統(tǒng)AMDF,說明均值下降趨勢對AMDF的性能影響較大,三類改進(jìn)算法均能較好克服均值下降趨勢對AMDF影響;EMDAMDF及LSAMDF的%GPE基本無差距,均低于CAMDF及EAMDF,說明本文所提改進(jìn)框架(圖2)的正確性。該框架與兩類改進(jìn)AMDF方法(修正定義如CAMDF及補(bǔ)幀長如EAMDF)不但具有較大優(yōu)勢,且以線性多項(xiàng)式近似表示均值下降趨勢完全合理可行。

        表1 五種算法檢測結(jié)果(單位:%GPE)Tab.1 Detection results of the five algorithms in terms of%GPE

        最后,實(shí)驗(yàn)中隨機(jī)選取每組100幀共三組濁音語音信號分別用五種算法進(jìn)行檢測,統(tǒng)計執(zhí)行時間。實(shí)驗(yàn)用 PC機(jī)為聯(lián)想啟天 M4300(CPU:i3-2120(3.30 GHz雙核),內(nèi)存:2G),軟件平臺為 MATLAB2009a。由表2看出,四種改進(jìn)算法的平均執(zhí)行時間分別為傳統(tǒng)AMDF的4.78、1.48、23.29、1.23倍,LSAMDF不僅擁有EMDAMDF的高檢測準(zhǔn)確率,且算法復(fù)雜度明顯低于 EMDAMDF、CAMDF及EAMDF。結(jié)合圖4、表1、表2三組實(shí)驗(yàn)看出,LSAMDF的綜合性能明顯優(yōu)于其它三種改進(jìn)算法。由此表明本文算法改進(jìn)框架正確;以線性趨勢表示均值下降趨勢的假設(shè)合理可行。

        表2 五種算法執(zhí)行時間(單位:s)Tab.2 Performing time of the five algorithms in terms of Seconds

        4 結(jié) 論

        (1)本文提出基于去均值下降趨勢的AMDF基音檢測算法改進(jìn)框架;通過分析AMDF的EMD分解提出利用線性趨勢表示AMDF的均值下降趨勢假設(shè);利用最小二乘法擬合線性趨勢,從AMDF中減去近似下降趨勢,獲得改進(jìn)的LSAMDF。

        (2)仿真實(shí)驗(yàn)結(jié)果驗(yàn)證了去均值下降趨勢改進(jìn)AMDF框架的合理性及以線性趨勢表示均值下降趨勢假設(shè)的可行性。LSAMDF性能明顯優(yōu)于傳統(tǒng)AMDF、EAMDF及CAMDF且不劣于EMDAMDF,算法復(fù)雜度明顯低于EMDAMDF。

        [1]Krubsack D A,Niederjohn R J.An autocerrelation pitch detector and voicing decision with confidence measures developed for noise corrupted speech[J].IEEE Transactions on Signal Processing,1991,39(2):319-329.

        [2]Ross M,Shaffer H,F(xiàn)reudberg R,et al.Average magnitude difference function pitch extractor[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1974,22(5):353-362.

        [3]Ahmadi S,Spanias A S.Cepsrumbased pitch detection using a new statistical V/UV classification algorithm[J].IEEE Transactions on Speech and Audio Processing,1999,7(3):333-338.

        [4]Kadame S,BroudreauxBartels G F.Application of the wavelet transform for pitch detection of speech signals[J].IEEE Transactions on Information Theory,1992,38(2):917-924.

        [5]Shimamura T,Kobayashi H.Weighted autocorrelation for pitch extraction of noisy speech[J].IEEE Transactions on Speech and Audio Processing,2001,9(7):727-730.

        [6]Amado G.Pitch detection algorithms based on zerocross rate and autocorrelation function for musical notes[C].//Proceedings of ICALIP.Shanghai:IEEE,2008:449-454.

        [7]Zhang W,Xu G,Wang Y.Pitch estimation based on circular AMDF[C].//Proceedings of ICASSP. Beijing: IEEE,2002:341-344.

        [8]Muhammad G.Noise robust pitch detection based on extended AMDF[C].//Proceedings of ISSPIT.Sarajevo:IEEE,2008:133-138.

        [9]顧良,劉潤生.高性能漢語語音基音周期估計[J].電子學(xué)報,1999,27(1):8-11.GU Liang,LIU Runsheng.Highperformance mandarin pitch estimation[J].Acta Electronica Sinica,1999,27(1):8-11.

        [10]梁升,王新晴,王東,等.基于 MMEMD的改進(jìn) HHT及應(yīng)用[J].振動與沖擊,2012,31(20):23-26.LIANG Sheng, WANG Xinqing, WANG Dong, et al.Improved HHT based on MMEMD and its application[J].Journal of Vibration and Shock,2012,31(20):23-26.

        [11]宗源,曾毓敏,孫永熙,等.基于EMD的AMDF基音檢測改進(jìn)算法[J].南京師范大學(xué)學(xué)報(工程技術(shù)版),2013,13(1):62-67.ZONG Yuan, ZENG Yumin, SUN Yongxi, et al. A modified AMDF Pitch detection algorithm based on EMD[J].Journal of Nanjing Normal University(Engineering and Technology Edition),2013,13(1):62-67.

        [12]李秀坤,李婷婷,馬濤.微弱信號強(qiáng)干擾分離方法研究[J].振動與沖擊,2011,30(3):225-227.LI Xiukun,LI Tingting,MA Tao.The research on strong interference separation of week signal[J]. Journal of Vibration and Shock,2011,30(3):225-227.

        [13]胡燦陽,陳清軍.基于EMD和最小二乘法的基線飄移研究[J].振動與沖擊,2010,29(3):162-167.HU Canyang,CHEN Qingjun.Research on baseline drift using leastsquare and EMD[J].Journal of Vibration and Shock,2010,29(3):162-167.

        [14]Leon SJ.Linear algebra with applications[M].New York:Macmillan,1980.

        [15] Meyer G,Plante F,Ainsworth W A.A pitch extraction reference database[C].//Proceedings of Eurospeech,Madrid:ISCA,1995:827-840.

        [16]Rabiner L R,Cheng M J,McGonegal C A.A comparative performance study of several pitch detection algorithms[J].IEEE Transactions on Acoustics,Speech and Signal Processing,1976,24(5):399-417.

        猜你喜歡
        趨勢信號檢測
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        趨勢
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        完形填空二則
        基于FPGA的多功能信號發(fā)生器的設(shè)計
        電子制作(2018年11期)2018-08-04 03:25:42
        初秋唇妝趨勢
        Coco薇(2017年9期)2017-09-07 21:23:49
        小波變換在PCB缺陷檢測中的應(yīng)用
        SPINEXPO?2017春夏流行趨勢
        日本在线一区二区免费| 国产精品久久久久国产a级| 国产精品自在线免费| 日韩一区二区三区中文字幕| 亚洲av美女在线播放啊| 蜜桃视频在线免费观看完整版| 青青草成人在线播放视频 | 美丽人妻在夫前被黑人| 国产精品香蕉在线观看| 伊人狠狠色j香婷婷综合| 激情五月六月婷婷俺来也| 蜜臀av在线观看| 中文字幕日韩一区二区三区不卡| 青青草视频华人绿色在线| 国产自拍视频一区在线| 狠狠摸狠狠澡| 欧美亚洲日韩国产人成在线播放 | 成熟人妻av无码专区| 国产精品久久久亚洲第一牛牛| 亚洲一本二区偷拍精品| 人人妻人人澡人人爽超污| 日韩精品无码一区二区三区视频 | 国产91精品清纯白嫩| 粗大猛烈进出高潮视频大全| 日本aⅴ大伊香蕉精品视频| 99热成人精品国产免国语的| 羞涩色进入亚洲一区二区av| 欧美奶涨边摸边做爰视频| 国产96在线 | 欧美| 音影先锋色天堂av电影妓女久久| 特级黄色大片性久久久| 少妇精品无码一区二区三区| 成年女人永久免费看片| 亚洲精品二区在线观看| 国产桃色一区二区三区| 天天做天天爱夜夜爽| 国产zzjjzzjj视频全免费| 国产亚洲精品性爱视频| 男女激情视频网站在线| 天堂√在线中文官网在线| 中国大陆一级毛片|