亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語音信號處理中基頻提取算法綜述

        2010-01-27 01:19:24龍子夜陳詠麗秦玉英
        電子科技大學(xué)學(xué)報 2010年1期
        關(guān)鍵詞:信號方法

        張 杰,龍子夜,張 博,陳詠麗,秦玉英

        (海軍裝備研究院 北京 昌平區(qū) 102249)

        式中 W為窗長。為了減少高次諧波處的谷值帶來的錯誤,可以用累計平均函數(shù)代替式(4)定義的差異函數(shù)。平均函數(shù)表示為:

        語音信號處理中基頻提取算法綜述

        張 杰,龍子夜,張 博,陳詠麗,秦玉英

        (海軍裝備研究院 北京 昌平區(qū) 102249)

        基頻提取在語音信號處理領(lǐng)域是一個基礎(chǔ)的課題。經(jīng)過多年的研究,現(xiàn)在的技術(shù)在準(zhǔn)確率和魯棒性方面還沒有達(dá)到一個十分令人滿意的水平。當(dāng)語音是一個干凈的語音時,大部分的基頻提取算法的結(jié)果都很好,但是當(dāng)語音中混有較強的噪聲,或者語音是多個語音的混合,從而同時含有多個基頻的時候,很多現(xiàn)在的技術(shù)都表現(xiàn)得不好。該文介紹了若干主要的基頻提取算法,并對這些算法的改進(jìn)進(jìn)行了討論。

        濾波器; 基頻提取; 語音信號處理; 小波變換

        語音分辯的一個主要特征是激勵的類型,根據(jù)激勵類型的不同,可以將語音信號分為濁音和清音兩大類。語音中只有濁音才有基頻,濁音的激勵是周期性的脈沖串,脈沖串的頻率就是基音頻率,簡稱基頻。由于發(fā)聲器官生理方面的差異,男性和女性的基頻范圍不同,一般地,男性的基頻范圍為50~250 Hz;女性的基頻范圍為120~500 Hz;嬰兒的基頻范圍大約為250~800 Hz;新生嬰兒的哭聲基頻范圍則更高[1-4]。

        語音信號是非平穩(wěn)的,因此語音信號處理也必須是短時的,即在一個短的時間窗內(nèi)處理語音信號。窗長取決于語音信號的特征,通常至少要包括兩個基音周期。

        語音基頻提取在語音信號處理領(lǐng)域有很多應(yīng)用,如語音分離、語音合成等。對于漢語的語音識別來說,在沒有考慮韻律的情況下,當(dāng)前的主流語音識別技術(shù)沒有用到基頻?;l是韻律的重要部分,所以如果要把韻律信息加入語音識別系統(tǒng),基頻提取是必須的。如何加入韻律信息也是漢語語音識別系統(tǒng)的重要研究方向。

        根據(jù)處理域的不同,可將基頻提取算法分為時域的算法、頻域的算法、統(tǒng)計的算法3類。

        1 時域的算法

        因為語音信號的時域波形代表了隨時間變化的聲音激勵的變化,基頻提取的最基本方法就是通過觀察語音信號的波形,并從波形中檢測出基頻。

        1.1 時域的事件發(fā)生率檢測

        基頻提取方法中的一些方法是試圖通過觀察語音信號的波形重復(fù)自己的頻率,估計基頻。這些方法的理論依據(jù)是,如果語音信號是周期的,那么就會有隨著時間不斷重復(fù)出現(xiàn)的事件發(fā)生,統(tǒng)計這些事件在單位時間內(nèi)的發(fā)生次數(shù),就能估計出基頻。

        1.1.1 過零率

        簡單地說,過零率就是單位時間內(nèi)波形通過零點的次數(shù)。開始對過零率的性能存有懷疑,但最近過零率方法由于文獻(xiàn)[5]而變得流行和活躍起來。使用過零率的一個重要目的就是提取基頻,研究者曾經(jīng)認(rèn)為過零率與波形在單位時間內(nèi)重復(fù)的次數(shù)有直接關(guān)系。但是不久人們就發(fā)現(xiàn)了以這樣的思路使用過零率提取基頻的方法有問題[6]。如果信號的能量都集中在基頻附近,那么一個周期內(nèi)它將兩次穿過零。但是如果信號包含了高頻能量,在一個周期內(nèi)它穿過零的次數(shù)將大于2。所以如果使用過零率檢測基頻,要先濾掉高頻成分。確定濾波器的截止頻率,既要盡可能多地去掉高頻成分,又要防止基頻被濾掉。另一個可能的使用過零率提取基頻的方法是先識別出過零率的模式,然后基于信號的模式估計基頻。

        1.1.2 峰值率

        時域的算法統(tǒng)計在單位時間內(nèi)波形峰值出現(xiàn)的次數(shù)。理論上,信號在一個周期內(nèi)有一個最大值和一個最小值,所以只需要統(tǒng)計單位時間內(nèi)最大值的個數(shù)就可估計語音的基頻。局部的峰值檢測器必須用于檢測信號在局部的最大值,單位時間內(nèi)的最大值個數(shù)就是語音的基頻。從另一個角度考慮,相鄰兩個最大值的時間差的倒數(shù)也可以用于估計基頻。

        1.1.3 信號導(dǎo)數(shù)的事件檢測

        如果信號是周期性的,那么信號的導(dǎo)數(shù)也是周期性的,而且信號周期與原始語音信號的周期相同。所以過零率和峰值率兩種算法對于信號的導(dǎo)數(shù)同樣適用。某些情況下,在信號的導(dǎo)數(shù)上檢測過零率或峰值率,會比在原始信號上直接檢測過零率或峰值率包含更多的信息,或者更加魯棒,這取決于信號本身的特性。

        1.2 自相關(guān)函數(shù)法

        以兩個信號之間的相關(guān)函數(shù)度量它們之間的相似性,相關(guān)函數(shù)的結(jié)果隨兩個信號波形開始時間的延遲而變化。自相關(guān)函數(shù)是信號自身的相關(guān)函數(shù),以自相關(guān)函數(shù)度量信號自身的相似性。對于無限長的離散信號x[n],自相關(guān)函數(shù)的定義為:

        式中 v為信號的延時,對于一般的8 kHz采樣的語音信號,取值范圍為20~150,相應(yīng)的基音頻率范圍為60~500 Hz。

        對于長度為N的離散信號x′[n],自相關(guān)函數(shù)的定義為:

        對于周期性函數(shù),自相關(guān)函數(shù)也呈現(xiàn)周期性,并且在基音周期的各個整數(shù)點上有很大的峰值。只要找到第一最大峰值點的位置并計算它與v=0點的間隔,便能估計出基音周期,而基音周期的倒數(shù)就是基頻。為了防止窗長過短引起計算的錯誤,需要使窗長至少大于兩個基音周期,才可能取得較好的計算結(jié)果。

        1.3 平均幅度差函數(shù)法

        還可以采用平均幅度差函數(shù)法求基頻,計算公式為:

        與自相關(guān)函數(shù)法相同,對于周期性的函數(shù)x(n),平均幅度差函數(shù)r(v)也呈現(xiàn)周期性,不同點在于自相關(guān)函數(shù)法的結(jié)果在基音周期的各個整數(shù)點有很大的峰值,而平均幅度差函數(shù)法在基音周期的各個整數(shù)點有谷值。

        1.4 陰陽估計法

        文獻(xiàn)[7]根據(jù)東方陰陽平衡的哲學(xué)理論提出陰陽估計法,該方法試圖在自相關(guān)函數(shù)的生成和取消之間取得平衡。自相關(guān)函數(shù)法的難點在于峰值也會出現(xiàn)在諧波處,所以有時很難判斷哪個峰值對應(yīng)基頻。陰陽估計法基于差異函數(shù),與前面的平均幅度差函數(shù)法一樣,在基音周期的整數(shù)倍點取得谷值。差異函數(shù)表示為:

        式中 W為窗長。為了減少高次諧波處的谷值帶來的錯誤,可以用累計平均函數(shù)代替式(4)定義的差異函數(shù)。平均函數(shù)表示為:

        平均函數(shù)用差異函數(shù)除以它前面所有值的均值,與差異函數(shù)不同,它在延遲為0時的值是1而不是0,并且在延遲很小時都能取得較大值,在差異函數(shù)的值小于其前面的均值時才降到1以下。使用式(5)的優(yōu)點是:(1) 減小錯誤率。(2) 避免原來延遲為0時的谷值影響。(3) 歸一化結(jié)果,為后續(xù)處理帶來方便。要了解更加詳細(xì)的處理過程,請參看文獻(xiàn)[7]。

        2 頻域的算法

        頻域有更多的與基頻相關(guān)的信息。具有基頻的信號是由頻率具有諧波關(guān)系的信號組成的,因此有很多嘗試?yán)妙l域信息提取基頻的方法。

        2.1 基于濾波器的算法

        2.1.1 最佳梳狀濾波器法

        最佳梳狀濾波器法[8]是具有高魯棒性但計算代價很大的算法。一個梳狀濾波器有很多等距離分布的通帶,在最佳梳狀濾波器算法中,通帶的位置都是由第一個通帶決定的,即通帶的中心頻率都是第一個通帶中心頻率的整數(shù)倍。輸入信號通過多個與第一個通帶中心頻率不同的梳狀濾波器。如果輸入信號是由一組頻率成諧波關(guān)系的信號組成的,那么濾波器的輸出在全部諧波成分都通過濾波器時達(dá)到最大。但是如果信號只有一個基頻成分,該方法就會失效,因為會有很多個梳狀濾波器能讓信號通過。不過,語音信號的頻率具有諧波結(jié)構(gòu),所以可采用該方法提取基頻。

        2.1.2 可調(diào)的IIR濾波器

        文獻(xiàn)[9]提出了一種基于中心頻率可調(diào)節(jié)的帶通IIR濾波器提取基頻的方法,隨著用戶的調(diào)節(jié),濾波器的中心頻率掃過整個頻域。當(dāng)輸入信號的一個強的頻率成分在通帶范圍內(nèi)時,濾波器會輸出最大值,信號的基頻就可以用此時濾波器的中心頻率來估計。文獻(xiàn)[9]提到,對于可調(diào)的IIR濾波器,有經(jīng)驗的用戶能夠識別具有一個諧波結(jié)構(gòu)的信號的輸出和包含多個基頻信號的輸出的差異。

        2.2 倒譜分析法

        倒譜分析是譜分析的一種方法,輸出是傅里葉變換的幅度譜取對數(shù)后做傅里葉逆變換的結(jié)果。該方法所依據(jù)的理論是,一個具有基頻的信號的傅立葉變換的幅度譜有一些等距離分布的峰值,代表信號中的諧波結(jié)構(gòu),當(dāng)對幅度譜取對數(shù)之后,這些峰值被削弱到一個可用的范圍。幅度譜取對數(shù)后得到的結(jié)果是在頻域的一個周期信號,而這個頻域信號的周期(是頻率值)可以認(rèn)為就是原始信號的基頻,所以對這個信號做傅里葉逆變換就可以在原始信號的基音周期處得到一個峰值。

        另外,如果對信號的傅里葉變換的幅度譜取對數(shù)后的結(jié)果直接進(jìn)行分析,而不是再接著做傅里葉逆變換,就是諧波成分譜的方法。進(jìn)一步,如果在求頻域的變換時不使用傅里葉變換,而使用能使頻譜更加精細(xì)的Chirp變換,就是基于Chirp變換的提取基頻的方法,該方法具有高分辨率和高魯棒性。

        2.3 多分辨率的方法

        對于任何基于傅里葉分析的頻域方法都可以做的一個改進(jìn)是采用多分辨率方法。該方法的思想是:如果一個特定算法在特定分辨率下的準(zhǔn)確性是可疑的,那么采用更高或者更低的分辨率,可以進(jìn)一步判斷前面的基頻估計是否可信。如果在全部或大部分的分辨率下求得相同的基頻,那么該頻率值就可以作為最終的基頻估計結(jié)果。當(dāng)然,在帶來好處的同時,該方法也會帶來計算量上的代價,因為針對每一個分辨率都需要重新計算頻譜,這也是為什么多分辨率的傅里葉分析比專門的多分辨率變換(如離散小波變換)要慢的原因。

        2.4 離散小波變換法

        離散小波變換是一個強大的工具,它允許在連續(xù)的尺度上把信號分解為高頻成分和低頻成分,它是時間和頻率的局部變換,能有效地從信號中提取信息。與快速傅里葉變換相比,離散小波變換的主要好處在于,在高頻部分它可以取得好的時間分辨率,在低頻部分可以取得好的頻率分辨率。

        3 統(tǒng)計的方法

        在某種意義上,基頻提取的問題可以被看作是一個統(tǒng)計問題。每一個輸入幀都被劃分給一組類中的一個,代表信號的基頻估計。所以很多研究者一直試圖將現(xiàn)代的統(tǒng)計方法應(yīng)用于基頻提取問題。

        Boris和Xavier發(fā)表了一系列使用最大似然法估計基頻的方法。他們的模型如下:觀察集是語音信號分幀后做短時傅里葉變換的結(jié)果,每一個觀察都被看作是基頻激勵產(chǎn)生的信號與其他剩余信息(包括非諧波部分和噪聲)兩部分的混合。該模型是由一般的語音信號產(chǎn)生的模型的簡單化得到的,假設(shè)一個語音包括在基頻及其整數(shù)倍點的值處較大的諧波成分,以及在非諧波處和噪聲處的很小的值。對于一組候選的基頻值,該方法計算每一個觀察可能是由某一個基頻產(chǎn)生的概率,并將概率最大的基頻值作為最終的估計值。所以候選的基頻值的選擇是很重要的,因為從理論上講,觀察可能對應(yīng)著任意的基頻值。

        4 算法的改進(jìn)

        前面提到的每種算法都有自己的改進(jìn)方法,下面介紹兩種對以上大部分算法均適用的改進(jìn)方法。

        4.1 人的聽覺模型

        由于基頻提取本身就是聽覺感知問題,所以所有的算法都可通過加入人耳的聽覺模型提高性能。人耳的聽覺模型將人的聽覺系統(tǒng)對聲音信號的處理分為分析、傳遞和還原3個階段。分析階段主要考慮耳蝸的分頻效應(yīng),耳蝸的外端對高頻敏感,內(nèi)端對低頻敏感,可以用一組中心頻率不同的帶通濾波器來模擬。傳遞階段聲波振動沿基膜傳播,并在聽覺神經(jīng)纖維內(nèi)產(chǎn)生電流,最終傳入聽覺中樞。還原階段聽覺系統(tǒng)提取語音中諸如音質(zhì)、音調(diào)、時域和位置等信息。

        在聲學(xué)中,聲強是指單位時間內(nèi)通過垂直于聲波傳播方向的單位面積的聲波能量,用I表示。當(dāng)聲波的頻率在20~20 000 Hz(可聞頻率)之間,而聲強達(dá)到一定的強度(聽閾),就能被人耳感知。前人大量的實驗測試結(jié)果表明,人耳對不同頻率的聲波感受到相同響度時的聲強是不同的。人耳對兩端頻段的聲波反應(yīng)較為遲鈍,而對中間頻段的聲波反應(yīng)相對較為敏感。

        對于任意的頻域方法,簡單的改進(jìn)是用Q值恒定的譜變換方法代替傅里葉變換。恒Q的變換方法計算代價更大,但更接近于人的聽覺感知系統(tǒng)。

        在決定是否使用人的聽覺模型時必須考慮兩個因素:(1) 基頻提取的用途。如果應(yīng)用的目的很簡單,要求也不是太高,那么人的聽覺感知因素也許不是很必要。(2) 計算的復(fù)雜度。使用人的聽覺感知模型會使計算復(fù)雜度大大增加,如果原來算法的復(fù)雜度已經(jīng)很大,再加入人的聽覺感知模型可能會使算法的復(fù)雜度過高。

        4.2 基頻的跟蹤

        另一種對基頻提取的改進(jìn)是基頻跟蹤。前面提到的基頻提取都是在一個單獨的時間窗內(nèi)進(jìn)行的。人的聽覺系統(tǒng)是能夠跟蹤輸入信號的基頻的。一個只包含有限個基音周期的時間窗內(nèi)的基頻是很難提取的。但是,如果輸入是連續(xù)的語音信號,相當(dāng)于很多時間窗一個接一個輸入,基頻的提取反而變得很容易。研究發(fā)現(xiàn),語音信號的基頻具有連續(xù)性,即前后兩幀的基頻是連續(xù)的,不出現(xiàn)跳變。一幀內(nèi)的基頻提取常見的問題是得到的估計值是正確值的整數(shù)倍或者整數(shù)倍分之一。針對該問題,利用語音信號基頻的連續(xù)性,可對基頻提取算法做一個簡單的改進(jìn):在計算某一幀的基頻時對于它前面一幀的基頻附近的值給予更大的可能性,即一幀語音信號中基頻的值不可能出現(xiàn)跳變的情況。這就是簡單的基頻跟蹤思想,并且不會在計算上增加任何復(fù)雜度。

        另外一種比較復(fù)雜的基頻跟蹤方法是使用隱馬爾科夫模型。

        5 經(jīng)典的基頻檢測方法

        自從有了語音信號分析研究這門學(xué)科以來,基頻的檢測一直是一個重點研究的課題。經(jīng)典的基頻檢測方法可以大致分為3類,如表1所示。

        表1 經(jīng)典的基音檢測方法以及特點

        (1) 波形估計法。直接由語音波形估計、分析波形上的周期峰值。

        (2) 相關(guān)處理法。時域中周期信號最明顯的特征是波形的類似性,因而可以通過比較原始信號和它位移后的信號之間的相似性確定基音周期。該類方法抗波形的相位失真能力強,且硬件處理結(jié)構(gòu)簡單。

        (3) 變換法。將語音信號變換至頻域或倒譜域估計基音周期

        6 總 結(jié)

        本文列出了若干基頻提取的主要方法,對它們分別進(jìn)行了簡單的介紹,并討論了對算法的改進(jìn)。需要注意的是,所介紹的方法都是針對一個語音信號而言的,對于混合的語音信號的基頻提取,如果可以先將混合的語音信號分離開,那么基頻提取就會變得很簡單。同樣地,在一些基于時頻分析的語音分離算法中,如果知道了各個語音的基頻,那么語音分離也就變得很容易解決了。

        [1] DELLER J R, PROAKIS J G, HANSEN J H L.Discrete-time processing of speech signals[M]. New York:Maxell McMillan, 1993.

        [2] FORT A, ISMAELLI A, MANFREDI C, et al. Parametric and non-parametric estimation of speech formants:application to infant cry[J]. Med Eng Phys, 1996, 18(8):677-691.

        [3] PARSONS T. Voice and speech processing[M]. New York:McGraw Hill, 1986.

        [4] RABINER R L, SCHAFER R W. Digital processing of speech signals. Englewood Cliffs[M]. New Jersey: Prentice-Hall, 1978.

        [5] BENJAMIN K. Spectral analysis and discrimination by zero-crossings[C]//Proceedings of the Institute of Electrical and Electronics Engineers. [S.l.]: [s.n.], 1986: 1477-1493.

        [6] CURTIS R. The computer music tutorial[M]. Cambridge:MIT Press, 1996.

        [7] DE CHEVEIGNE A, YIN H K. A fundamental frequency estimator for speech and music[J]. Journal of the Acoustical Society of America, 2002, 111(4): 1917-1930.

        [8] EARGLE J M. Music, sound and technology[M]. Toronto:Van Nostrand Reinhold, 1995.

        A Summarize of Pitch Detection Algorithmic in Speech Signals Processing

        ZHANG Jie, LONG Zi-ye, ZHANG Bo, CHEN Yong-li, and QIN Yu-ying

        (Naval Academy of Armament Changping Beijing 102249)

        Pitch detection is a basic topic in speech signals processing. Through many years’ research, there is yet a satisfied technology in terms of accuracy and robust. When the speech is clean, most of the pitch detection algorithms are fine, but many technologies are not satisfied when the speech mixed with noise or the speech is a mixture of multi-speech. This paper introduces some mainstream pitch detection algorithms, and discusses the improvement of these algorithms.

        filter; pitch detection; speech signals processing; wavelet transformation

        TN912.3

        A

        10.3969/j.issn.1001-0548.2010.z1.024

        2009 ? 11 ? 15

        張 杰(1976 ? ),女,工程師,主要從事信號處理和計算機應(yīng)用等方面的研究.

        編 輯 稅 紅

        猜你喜歡
        信號方法
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        完形填空二則
        學(xué)習(xí)方法
        孩子停止長個的信號
        可能是方法不對
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        基于LabVIEW的力加載信號采集與PID控制
        一種基于極大似然估計的信號盲抽取算法
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢方法
        日韩av无码一区二区三区| 免费毛片在线视频| av少妇偷窃癖在线观看| 麻豆视频在线观看免费在线观看| 91视色国内揄拍国内精品人妻| 色偷偷亚洲第一成人综合网址| 人妻无码一区二区三区四区| 久久青青草原国产精品最新片| 香蕉蜜桃av一区二区三区| 亚洲综合图色40p| 欧美操逼视频| 精品亚洲欧美高清不卡高清| 日本高清一区二区三区不卡| 国产精品久久久天天影视| 极品粉嫩小泬无遮挡20p| 在线观看网址你懂的| 国产精品日本中文在线| 精品一区二区三区在线视频| 免费观看又色又爽又黄的| 日韩高清无码中文字幕综合一二三区| 少妇被日到高潮的视频| 日韩精品第一区二区三区| 大肉大捧一进一出视频 | 人妻熟女中文字幕av| 天天躁夜夜躁狠狠是什么心态| 国产欧美日韩久久久久| 欧美日韩综合在线视频免费看| 久久综合激情的五月天| 亚洲国产成人精品无码区在线秒播| 精品人体无码一区二区三区| 女同成片av免费观看| 国产精品狼人久久影院软件介绍| 国产农村乱辈无码| 国产免费av片在线观看播放| 日本美女性亚洲精品黄色| 欧美伦费免费全部午夜最新| 日日躁夜夜躁狠狠躁超碰97| 无码人妻丰满熟妇区免费| 国产精品国产av一区二区三区| 欧美最大胆的西西人体44| 亚洲 日韩 在线精品|