亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        改進LVAMDF及綜合多因素基音檢測算法

        2016-10-31 08:46:10薛帥強
        計算機測量與控制 2016年4期
        關(guān)鍵詞:基音倍頻端點

        薛帥強,陳 波,陳 菲

        (西南科技大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,四川 綿陽 621010)

        ?

        改進LVAMDF及綜合多因素基音檢測算法

        薛帥強,陳波,陳菲

        (西南科技大學(xué) 計算機科學(xué)與技術(shù)學(xué)院,四川 綿陽621010)

        在對語音信號靜音、清音、濁音劃分的基礎(chǔ)上,針對語音信號周期特征明顯段分布隨機性問題,提出改進的變長度平均幅度差函數(shù)LVAMDF及綜合多因素基音檢測算法,該算法對語音信號進行周期特征明顯段和周期特征不明顯段的聚類劃分,同時,獲取周期特征明顯語音段的所有基音周期的起止端點,針對少數(shù)基音周期劃分倍頻或半頻問題,提出識別、修正方法,其識別、修正率極高;在對大量真實語音處理中,能夠精確地檢測出語音特征明顯段的基音周期端點,基本沒有倍頻和半頻劃分,并且和AMDF、ACF算法作了對比。

        改進的變長度平均幅度差函數(shù); 綜合多因素; 精確基音周期;修正倍頻或半頻

        0 引言

        語音基音周期是人類在發(fā)濁音過程中,聲帶振動的最小周期。語音基音周期檢測的準(zhǔn)確性,對語音識別、語音壓縮、語音編解碼、語音合成、說話人識別與語種辨識等等有至關(guān)重要的作用[1]。語音基音周期檢測方法有很多種,平均幅度差函數(shù)法(average magnitude difference function,AMDF)[2-4]、變長度短時平均幅度差函數(shù)法(length varied average magnitude difference function,LVAMDF)[5-7]、自相關(guān)函數(shù)法(autocorrelation function,ACF)[8]、希爾伯特-黃變換方法(hilbert-huang transform,HHT)[9]、小波變換法[10]等等,其中,LVAMDF是運算最簡單的方法,在實時語音處理過程中,底層運算應(yīng)盡可能簡單、穩(wěn)定,由于傳統(tǒng)的LVAMDF沒有對處理對象做選擇,所以在處理不適應(yīng)此方法的語音段時,會劃分錯誤,而且在處理適應(yīng)此方法的語音段時,有較多的倍頻和半頻劃分。

        本文提出了提取適用LVAMDF方法劃分基音周期語音段落的方法,改進了LVAMDF方法,并且綜合周期長度、端點振幅和最優(yōu)相似度選取因素精確估計基音周期端點,最后通過倍頻和半頻識別、修復(fù)和排除方法,大大減小了倍頻和半頻周期劃分。

        1 基音周期檢測原理

        基音周期檢測原理如圖1所示。

        圖1 基音周期檢測原理圖

        1.1預(yù)處理

        在接收到的語音信號中包含靜音、清音、噪音等復(fù)雜成分,這些成分在基音周期檢測中,是冗余部分,會使基音周期檢測錯誤和檢測速度下降,所以在基音周期檢測之前要將這些成分劃分開。

        排除靜音段方法:短時信號圍繞面積法,根據(jù)非靜音段的短時信號圍繞面積門限找到非靜音段的端點。

        排除非語音信號方法:語音信號頻率在50~450 Hz,18 ms為55.6 Hz,當(dāng)18 ms中都沒有2個以上正數(shù)最大極大值(兩個負(fù)數(shù)極小值之間所有正數(shù)極大值點中的最大值點)的周期端點,那么其頻率一定低于55.6 Hz,即為非語音段。

        排除有周期性的噪聲方法:根據(jù)人類語音濁音頻率范圍是50 Hz到450 Hz,在基音周期端點檢測后,根據(jù)頻率大小可判斷該非靜音語音是否為語音信號。本文使用有效翻轉(zhuǎn)率和頻譜振幅均值方法來劃分清濁語音信號。

        定義1(短時信號圍繞面積):對一幀信號作一次擬合,擬合后的曲線和橫軸圍繞的平均面積就是短時信號圍繞面積。它是短時平均幅度函數(shù)[11]的變化。

        定義2(有效翻轉(zhuǎn)率):一個拐點和其兩側(cè)拐點的振幅差值大小比例都超過一個有效翻轉(zhuǎn)門限(本文用的是0.25)的時候,稱為一次有效翻轉(zhuǎn)。一幀語音信號中有效翻轉(zhuǎn)的個數(shù)就是有效翻轉(zhuǎn)率。它是短時過零率算法[12]的變化。

        1.2檢測基音周期

        首先將濁音信號劃分為周期特征明顯段和周期特征不明顯段,然后對周期特征明顯段進行基音周期檢測,最后將倍、半頻劃分進行檢測、修復(fù)和排除。

        周期特征明顯段和周期特征不明顯段劃分方法:如果某幀的第一周期和其整幀的周期預(yù)劃分成功,則該幀確定為周期特征明顯段,否則為周期特征不明顯段。

        倍頻和半頻劃分檢測、修復(fù)和排除方法:1)對周期特征明顯段語音幀按周期長度分類,對每類中任意一幀,尋找其最優(yōu)第一周期,如果最優(yōu)第一周期比歷史劃分中的第一周期相差超過倍頻或者半頻門限,就對該種類的語音幀進行周期端點修復(fù),修復(fù)時,用最優(yōu)第一周期確定LVAMDF算法中周期長度變量的變化范圍,確保再次劃分的正確性;2)由于倍頻和半頻劃分非常少,所占的比例非常少,所以本文將語音段按照周期長度分類,根據(jù)分類的統(tǒng)計結(jié)果,將所占比例非常少的部分視為倍頻或半頻,并將其排除。

        1.3LVAMDF算法

        傳統(tǒng)的AMDF算法[5]為公式:

        (1)

        式(1)中,語音采樣序列(sj)=(s1,s2,…,sN),N為樣本點總數(shù),τmin、τmax確定了基音周期范圍,一般為2~20 ms,L為樣本幅度差的計算范圍。

        AMDF算法的基音周期定義為公式(2):

        (2)

        歸一化的LVAMDF算法[6],其定義為公式(3):

        (3)

        歸一化的LVAMDF算法的基音周期定義為公式(4):

        (4)

        1.4LVAMDF算法改進

        在本文語音基音周期端點檢測過程中,改進LVAMDF算法在語音處理兩個不同階段進行,兩部分整合到一起,使得檢測結(jié)果非常精確。這兩個部分分別為:周期端點檢測部分,倍頻和半頻識別修正部分。

        1.4.1在周期端點檢測部分LVAMDF的優(yōu)化

        在語音信號基音周期檢測中,識別精度關(guān)鍵在于基音周期之間相似度(similarity)[13]的量化評估上,其定義如公式(6)所示。本文使用的基音周期之間相似度量化方法是改進的LVAMDF算法。

        由于語音信號有振幅的高低起伏變化,相鄰周期信號的對比差異就不能在同一個視角下觀察,為了將所有相鄰周期信號的對比運算大概放到同一個視角下進行,本文提出,用兩幀信號中最大的振幅和1的比例,對兩幀信號進行縮放,然后再進行對比運算。所以本文在式(3)分母中運用的是MAX(sj,sj+τ)*τ,保證所有相鄰周期對比運算在同一個視角上進行。如式(5)所示:

        (5)

        similarity=DL(τ)

        (6)

        此外,文獻(xiàn)[5]中提出LVAMDF中τmin和τmax分別為相鄰幀基音周期的±0.1~0.2倍。為了更加精確地估算τmin和τmax值,避免幀和幀之間周期長度差異超過估算范圍(相距比較遠(yuǎn)的幀,周期長度相差比較大),本文將相鄰周期基音周期長度的±0.1~0.2倍分別作為τmin和τmax。即定義為式(7)和(8):

        (7)

        (8)

        因此,準(zhǔn)確找到一幀中的第一個周期至關(guān)重要,本文提出了和文獻(xiàn)[5]不同的第一周期尋找方法,其流程如圖2所示。

        圖2 尋找某幀第一個基音周期流程圖

        對圖2的解釋和補充:

        1)周期端點都在正數(shù)極大值上尋找。

        2)第一周期的起始端點設(shè)定在盡可能大的正數(shù)極大值點上,第一周期的結(jié)束端點在起始端點的附近;

        3)第一周期起、止端點振幅大小比值允許范圍為0.7~1.3,大小比值公式如式(9)所示:

        (9)

        4)本文在選擇第一周期結(jié)束端點的時候,是從符合1)、2)和3)條的預(yù)選端點中,先向后面由近及遠(yuǎn)嘗試劃分,如果沒有找到,再向前由近及遠(yuǎn)嘗試劃分,運用這種方法,當(dāng)找到第一個通過第一周期驗證的周期,就是第一周期。

        5)第一周期的驗證方法為雙層驗證法。第一層驗證為第一周期和第二周期相似度大小高標(biāo)準(zhǔn)驗證(由于相鄰周期的周期長度并非完全相等,所以在對比時有左對齊對比和右對齊對比,對于第一層驗證,兩種對齊方式的對比都要作,以保證第一周期的起、止位置最合適),即相似度量化值門限設(shè)定為0.172 9(這個門限是由語音信號統(tǒng)計出來的),并且在滿足該門限的同時選擇相似度量化值最小值;第二層驗證為該幀中其他相鄰周期之間相似度(只作新端點方向?qū)R對比)大小低標(biāo)準(zhǔn)通過并且能順次將該幀完全劃分,其相似度量化門限設(shè)定為0.327 5,并且在兩周期相似度的量化中,實時改變LVAMDF算法中的窗長變化范圍。

        該方法大大減小了運算量,降低了倍頻的可能性。

        1.4.2在倍頻和半頻識別修正部分LVAMDF的優(yōu)化

        在周期端點檢測部分完成后,劃分的端點中會有倍頻或者半頻劃分,引起原因為:一幀中滿足第一周期條件的第一周期和第二周期的相似度量化值選擇錯誤,使得第一周期識別為倍頻或者半頻。

        為解決這種問題,本文對一幀所有滿足第一周期條件的第一周期和第二周期的相似度量化值進行優(yōu)化選擇,使其盡可能減少倍頻和半頻劃分。倍頻和半頻檢測流程如圖3所示。

        圖3 倍頻和半頻檢測流程圖

        本文首先對倍頻或半頻劃分幀中所有符合條件的第一周期進行統(tǒng)計,在統(tǒng)計中發(fā)現(xiàn),正確的第一周期總是分布在相似度量化值最小值附近,所以在相似度量化值最小值附近找第一周期端點。

        在文獻(xiàn)[14]中,運用預(yù)判谷值范圍方法的作用對象為歸一化LVAMDF分析曲線,目的是濾除歸一化LVAMDF分析曲線的毛刺谷值(倍頻或半頻谷值),如圖4第一條虛線所示,而本文運用預(yù)判谷值范圍作用對象為一幀中所有滿足第一周期條件的相似度量化值集合,目的是確定正確的周期端點,并且不需要計算歸一化LVAMDF分析曲線,只是計算第一周期相似度量化值,而且計算的幀數(shù)只有幾個(一段語音中按照周期長度差異大小,將周期長度分為不同的種類,只確定同一類中任意一幀的第一周期劃分是否正確即可),這樣極大的減少了運算量。

        圖4 周期性強的語音段的LVAMDF

        本文統(tǒng)計計算出來的預(yù)測谷值范圍如式(10)、(11):

        [similaritymin,similaritymin+0.04)

        (10)

        similaritymin=min某幀(similarity(1…n某幀第一周期))

        (11)

        similarity(1…n某幀第一周期)是某幀中所有滿足第一周期條件的相似度量化值集合。

        那么,在該范圍內(nèi)所有預(yù)選周期中長度最小的為第一周期。通過和歷史劃分周期長度對比,就可以判斷出歷史劃分是倍頻還是半頻,如圖5所示。

        圖5 第一周期準(zhǔn)確獲取圖例

        通過對LVAMDF值的優(yōu)化選擇,識別和修復(fù)了倍頻和半頻的劃分。

        2 實驗結(jié)果

        本文改進LVAMDF算法及其綜合調(diào)整周期長度、端點振幅和最優(yōu)相似度選取因素檢測方法通過Matlab實現(xiàn),實驗對象為基本涵蓋4個音調(diào)不同字母發(fā)音的189個語音信號,進行處理,其結(jié)果如下所述。

        圖6~圖9分別是ge1,ge2,ge3,ge4的原始信號時域圖和本文方法、AMDF算法、ACF算法的基音周期時間軌跡變化圖。

        圖6 ge1基音周期時間軌跡變化對比圖

        圖7 ge2基音周期時間軌跡變化對比圖

        圖8 ge3基音周期時間軌跡變化對比圖

        圖9 ge4基音周期時間軌跡變化對比圖

        從圖6~圖8中,可以看到AMDF算法有較多的錯誤或者半頻劃分,但是本文算法和ACF算法沒有錯誤的劃分,本文算法有自動識別不適合LVAMDF算法語音段的能力,并且將這部分語音段空出來,如圖8所示。

        本文算法可將周期特征明顯段的所有基音周期精確檢測出來,并且和AMDF算法檢測一個基音周期的運算量相當(dāng)。而AMDF和ACF算法只在一幀中檢測一個基音周期,如果用AMDF和ACF算法將所有基音周期都檢測出來運算量會成倍的增加。

        在實際應(yīng)用中,語音信號中會有噪聲混雜,為了檢測本算法的魯棒性,在原始語音中加入高斯白噪聲,分別采用AMDF法、ACF法和本方法在不同信噪比下對語音信號進行基音檢測,檢測結(jié)果如表1所示。

        表1 3種方法在不同信噪比下的基音檢測結(jié)果

        由表1可知,AMDF算法在信噪比降低的時候,基音檢測正確率急速下降,ACF算法和本文算法基本保持平衡,本文算法正確率相對于ACF算法有所提高。

        由于ACF算法中主要運用的是乘法運算,而本文算法中只是運用的加減運算,所以本文算法運算速度快,和AMDF算法運算速度相當(dāng)。

        從算法的精確度、運算量、魯棒性來看,本算法適合用于實時語音信號處理中。

        3 結(jié)束語

        根據(jù)語音信號的特點,本文分別用有效翻轉(zhuǎn)率、信號和橫軸圍繞面積、語音頻譜幅值均值,將靜音語音段、非語音段、清音段排除。又將濁音信號劃分為周期特征明顯段和周期特征不明顯段,在LVAMDF傳統(tǒng)算法基礎(chǔ)上,加上信號同視角變化相似度比較、第一周期的精確估計、LVAMDF窗長根據(jù)相鄰周期長度實時變化,精確的獲取到基音周期端點,對第一周期判定中少許的倍頻和半頻劃分,進行識別修復(fù)的處理,在修復(fù)過程中,通過分析整幀中所有符合第一周期的相似度量化值,找到最優(yōu)的第一周期,大大地降低了倍頻和半頻劃分,最后通過統(tǒng)計方法將未能修復(fù)的倍頻和半頻劃分(很少的可能)去除掉。在接下來的研究中,要對濁音中少部分周期特征不明顯段進行精確的基音周期端點檢測。

        [1] Jong soon J,Jeong Jin K,Myung J B.Pitch alteration technique in speech synthesis system[J].IEEE Transacions on Consumer Electronics,2001,47(1):163-167.

        [2] 馬莎莎,戴曙光,穆平安. 基于短時能量的循環(huán)AMDF基音檢測算法[J].計算機仿真,2014,31(7):278-282.

        [3] 鄭繼明,王勁松.語音基音周期檢測方法[J].計算機工程,2010,36(10):273-275.

        [4] 潘崢嶸,戴芮,張寧.改進的基音周期檢測算法研究[J].計算機工程與應(yīng)用,2015,51(10):223-226.

        [5] 顧良,劉潤生. 利用聲調(diào)判別提高漢語數(shù)碼語音識別性能[J].清華大學(xué)學(xué)報:自然科學(xué)版,1998,38(9):36-39.

        [6] 張康杰,趙歡,饒居華. 基于LV-AMDF的自適應(yīng)基音檢測算法[J].計算機應(yīng)用,2007,27(7):1674-1679.

        [7] Chrjstensen O. Localization and navigation of a mobile robot using natural point landmarks extracted from data[J].Robotics and Autonomous Systems,2000,33(3):131-142.

        [8] Krubsack D A,Niedeoohn R J.An autocorrelation pitch detector and voicing decision with confidence in ensures developed for noise corrupted speech[J].IEEE Trans. on Acoustics,Speech,Signal Processing,1991,39(2):319-329.

        [9] 焦蓓,曾以成,毛燕湖.基音周期檢測的希爾伯特-黃變換方法[J].計算機工程與應(yīng)用,2015,51(1):204-207.

        [10] Kadame S,Broudreaux B G F. Application of wavelet transform for pitch detection[J]. IEEE Trans. on IT,1992,38:917-924.

        [11] 吳恬盈. 一種新的清濁音在線辨識法[J].計算機仿真,2007,24(4):72-74.

        [12] Jalil M,Butt F A,Malik A. Short-time energy,magnitude,zero crossing rate and autocorrelation measurement for discriminating voiced and unvoiced segments of speech signals[A]. 2013 International Conference on Technological Advances in Electrical,Electronics and Computer Engineering (TAEECE)[C]. IEEE,2013: 208-212.

        [13] 陳雪勤,劉正,趙鶴鳴. 基于相似度的高精度基音檢測算法[J].聲學(xué)技術(shù),2008,27(5):704-707.

        [14] 成新民,曾毓敏,趙力. 一種改進的AMDF求取語音基音的方法[J].微電子學(xué)與計算機,2005,22(11):162-164.

        Improved Algorithm of Length Varied Average Magnitude Difference Function (LVAMDF) and Comprehensive Multi-factor for Pitch Frequency Detection

        Xue Shuaiqiang,Chen Bo,Chen Fei

        (School of Computer Science and Technology,Southwest University of Science and Technology, Mianyang621010,China)

        On the basis of the methodology that categorizes speech signal into three types,silence,voiceless sound,voiced sound,in view of the random distribution of obvious periodic property speech,the improved algorithm of length varied average magnitude difference function (LVAMDF) and comprehensive multi-factor for pitch frequency detection is put forward to categorize voiced sound into two types,one is obvious periodic property speech,the other one is unobvious periodic property speech. At the same time,the starting and ending points of all accurate pitch period in the obvious periodic property speech is achieved. For a few pitch periods divided into frequency doubling or half frequency,the recognition and correction method is proposed which has a high recognition and correction rate. Finally,in a large amount of the real speech processing experiments,the method can detect the pitch period in the obvious periodic property speech accurately,and there is hardly frequency doubling and half frequency. The results show that the proposed algorithm performs much better on pitch detection compared with AMDF and ACF.

        improved algorithm of length varied average magnitude difference function(LVAMDF); comprehensive multi-factor; accurate pitch period; identify and correct frequency doubling and half frequency

        1671-4598(2016)04-0253-04DOI:10.16526/j.cnki.11-4762/tp.2016.04.073

        TP391.42

        A

        2015-11-02;

        2015-11-26。

        四川省教育廳重點項目(ZD1109); 綿陽市網(wǎng)絡(luò)融合工程實驗室開放基金項目(12ZXWK11)。

        薛帥強(1989-),男,河南省原陽縣人,碩士研究生,主要從事語音信號處理方向的研究。

        陳波(1963-),男,博士,教授,主要從事圖像處理、嵌入式技術(shù)方向的研究。

        猜你喜歡
        基音倍頻端點
        非特征端點條件下PM函數(shù)的迭代根
        不等式求解過程中端點的確定
        基于基音跟蹤的語音增強研究
        參數(shù)型Marcinkiewicz積分算子及其交換子的加權(quán)端點估計
        基丁能雖匹配延拓法LMD端點效應(yīng)處理
        基于LBO晶體三倍頻的激光實驗系統(tǒng)的研究
        脈沖單頻Nd∶YVO4激光器及其倍頻輸出特性研究
        樂理小知識
        小演奏家(2014年11期)2014-12-17 01:18:52
        一種改進的基音周期提取算法
        Q開關(guān)倍頻Nd:YAG激光治療激素依賴性皮炎療效觀察
        国产精品美女久久久久av福利| 成年人视频在线播放麻豆| 国产av无毛无遮挡网站| 亚洲色精品三区二区一区| 国外精品视频在线观看免费| 久久福利资源国产精品999| 亚洲中文字幕乱码在线视频| 亚洲av天堂在线视频| 强行无套内谢大学生初次| 无码人妻少妇久久中文字幕蜜桃 | 日日日日做夜夜夜夜做无码| 亚洲国产成人久久一区www| 99久久精品一区二区三区蜜臀| 午夜一区二区三区免费观看| 亚洲av午夜精品无码专区| 人人狠狠综合久久亚洲| 久久青草亚洲AV无码麻豆| 日本免费大片一区二区三区| 强开少妇嫩苞又嫩又紧九色| 亚洲av永久无码精品秋霞电影影院| 素人激情福利视频| 精品国产一区二区三区av免费| 精品区2区3区4区产品乱码9| 国产欧美日产久久| 久久精品中文字幕免费| 日出白浆视频在线播放| 一本一道久久综合狠狠老| 精品少妇人妻成人一区二区| 中文字幕乱码人妻在线| 亚洲av成人片在线观看| 天堂网www在线资源| 99久久无色码中文字幕鲁信| 视频在线国产一区二区| 麻豆久久久9性大片| 日本理论片一区二区三区| 综合激情五月三开心五月| 国产精品一卡二卡三卡| 久久亚洲Av无码专区| 邻居少妇张开腿让我爽视频| 午夜精品久久久久久久| 黄又色又污又爽又高潮动态图|