亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于AMDF的藏語語音基音周期檢測(cè)

        2008-12-31 00:00:00楊順元于洪志
        電腦知識(shí)與技術(shù) 2008年28期

        摘要:基音周期是語音信號(hào)最重要的參數(shù)之一,它描述了語音激勵(lì)源的一個(gè)重要特征。被廣泛應(yīng)用到語音合成、語音識(shí)別等領(lǐng)域。本文介紹了一種基于AMDF的語音基音周期檢測(cè)方法,較好的提取了語音的基音周期。

        關(guān)鍵詞:藏語;基音周期;自相關(guān);AMDF

        中圖分類號(hào):TP311文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2008)28-0100-03

        Pitch Detection of Tibetan Phonetic Based on AMDF

        YANG Shun-yuan,YU Hong-zhi

        (State Key Laboratory of National Languages Information Technology,Northwest University for Nationalities,Lanzhou 730030,China)

        Abstract: Pitch is one of the most important parameters in phonetic signal.It describes an important character of phonetic excitation source. Pitch applies widely to phonetic synthesis and phonetic recognition fields and so on. The thesis introduces an AMDF-based method that the effect of pitch detection is preferable.

        Key words: tibetan;pitch;autorelation;AMDF

        1 前言

        基音是指發(fā)濁音時(shí)聲帶振動(dòng)所引起的周期性,而基音周期是指聲帶振動(dòng)頻率的倒數(shù)?;舻奶崛『凸烙?jì)是語音信號(hào)處理中一個(gè)十分重要的問題,基音的變化模式成為聲調(diào),它攜帶著非常重要的具有辨意作用的信息。自從語音信號(hào)的研究以來,基音周期估計(jì)一直是個(gè)重要的研究課題,為此提出了很多方法,然而這些方法都有局限性;迄今為止,尚未找到一個(gè)完善的方法可以適用于不同的講話者、要求和環(huán)境,這是因?yàn)榛籼岢鲇性S多困難。

        基音周期估計(jì)的困難主要在于語音變化的不確定性和變化性,主要表現(xiàn)在:

        1) 語音信號(hào)常根據(jù)不同的發(fā)音而發(fā)生變化,這一變化降低了連續(xù)語音段的相關(guān)性,特別是在清濁音的過渡段以及基音周期發(fā)生抖動(dòng)過程,語音波形變化更為劇烈,加上無周期性的清音段語音和背景噪聲的影響,給基音周期的檢測(cè)造成了許多障礙。

        2) 即使當(dāng)發(fā)音穩(wěn)定的時(shí)候,由于通過聲門的脈沖幅度大小還是有區(qū)別的,如此一來,語音信號(hào)相當(dāng)于被調(diào)幅處理了,也給基音周期的檢測(cè)帶來了困難。

        3) 不同的人說話的基音周期頻率分布有所不同,男性主要分布在60—200Hz范圍內(nèi),女性和小孩主要分布在200—450Hz之間,基音檢測(cè)所跨頻率范圍比較大,必然會(huì)降低基音檢測(cè)的準(zhǔn)確性。

        基音周期的估計(jì)方法大致可以分為三類:

        1) 波形估計(jì)法\" 直接由語音波形來估計(jì)基音周期,分析出波形上的周期峰值,包括并行處理法(PPROC)、數(shù)據(jù)減少法(DARD)等

        2) 相關(guān)處理法。 計(jì)算語音信號(hào)的短時(shí)相關(guān)函數(shù),根據(jù)相關(guān)函數(shù)的周期性來獲得基音周期的估計(jì),常見的有自相關(guān)函數(shù)法(MAUTO)、平均振幅差分函數(shù)法(AMDF)簡化逆濾波法(SIFT)等。

        3) 變化法。將語音信號(hào)變換到頻域或者倒譜域來估計(jì)基音周期,比如倒譜法(CEP)等。其中相關(guān)處理法因?yàn)槠淇共ㄐ蜗辔皇д婺芰?qiáng),且在硬件處理上的結(jié)構(gòu)簡單而被廣泛應(yīng)用。

        2 提取基音周期的過程

        2.1 預(yù)處理

        由于聲道的共振峰特性會(huì)對(duì)語音周期造成干擾,為了較為準(zhǔn)確的估計(jì)基音周期,我們需要對(duì)原始信號(hào)進(jìn)行預(yù)處理。預(yù)處理的途徑有兩條:

        1) 用一個(gè)帶通為60Hz—90Hz的帶通濾波器對(duì)原始語音進(jìn)行濾波,這里截止頻率取900Hz,是因?yàn)榧瓤梢匀サ舸蟛糠止舱穹宓挠绊?,又可以為頻率低于450Hz以下的基音保留一兩次諧波。

        2) 對(duì)原始語音進(jìn)行中心削波,中心削波函數(shù)為

        其中中心削波電平CL約為最大信號(hào)幅度的60%—70%

        本文中選用一個(gè)帶通濾波器對(duì)原始語音進(jìn)行濾波,濾波器的參數(shù)如下:

        H[20]=

        {.0035270585, -.0075853243, -.022130724, -.037701912, -.040792551, -.017618544, .037134223, .1139423,.18955371, .23657782, .23657782,.18955371,.1139423,.037134223, -.017618544, -.040792551,-.037701912,-.022130724, -.0075853243, .0035270585

        };

        2.2 短時(shí)自相關(guān)函數(shù)和短時(shí)平均幅差函數(shù)

        一個(gè)時(shí)間離散確定信號(hào)的自關(guān)函數(shù)定義為:

        R(k)=■x(m+k)R(k)

        如果信號(hào)是隨機(jī)的或周期的,這時(shí)的定義是:

        R(k)=■■■x(m)x(m+k)

        在任一種情況下,信號(hào)的自關(guān)函數(shù)表示法都是描述信號(hào)一定特性的一種方便的方法。例如,如果信號(hào)是以p個(gè)抽樣為周期的,那么很容易給出:

        R(k)=R(k+p)

        也就是說,周期信號(hào)的自關(guān)函數(shù)也以同樣的周期為周期。自關(guān)函數(shù)的重要特性[21]還有:

        1) 它是一個(gè)偶函數(shù),即

        R(k)=R(-k)

        2) 存在最大值。對(duì)所有有: R(0)≥│R(k)│

        3) 對(duì)確定信號(hào),R(0)值等于信號(hào)能量;對(duì)隨機(jī)信號(hào)或周期信號(hào),R(0)值等于平均功率。

        由于短時(shí)自相關(guān)函數(shù)是偶函數(shù),所以寫成:

        R(k)=R(-k)= ■ x(m)x(m-k)w(n-m)w(n+k-m)

        若令hk(n)=w(n)w(n+k),則可以改寫為:

        Rn(k)= ■[x(m)x(m-k)]hk(n-m)=[x(n)x(n-k)]*hk(n)

        這意味著短時(shí)自相關(guān)函數(shù)可以視為[x(n)x(n-k)]通過沖激響應(yīng)為hk(n)的數(shù)字濾波器的輸出。

        實(shí)際處理時(shí)往往不采用數(shù)字濾波器來實(shí)現(xiàn),而是采用直接計(jì)算的方法。若令m=n+m′,并且w(-m)=w′(m),可以得到

        Rn(k)= ■[x(n+m)w′(m)][x(n+m+k)w′(m+k)]

        如果這里的w′(m)的窗口長度為0≤n<N-1 ,則上式又可簡化為

        Rn(k)= ■[x(n+m)w′(m)][x(n+m+k)w′(m+k)]

        在語音信號(hào)處理中,計(jì)算自相關(guān)函數(shù)所用的窗口長度與平均能量等情況略有不同。在這里,N值的選擇至少要大于音調(diào)周期的2倍,否則將找不出第二個(gè)最大點(diǎn) (除R(0)外最近的一個(gè)最大值點(diǎn))當(dāng)然,另一方面,N值也要盡可能地小,否則將影響短時(shí)性。為了解決這個(gè)問題,這里介紹一種 “變形短時(shí)自相關(guān)函數(shù)”來代替短時(shí)自相關(guān)函數(shù)的方法。變形短時(shí)自相關(guān)函數(shù)的定義如下:

        其中:

        由此可見,短時(shí)自相關(guān)函數(shù)是語音信號(hào)時(shí)域分析的重要參量。但是,計(jì)算自相關(guān)函數(shù)的運(yùn)算量是很大的,其原因是運(yùn)算乘積非常費(fèi)時(shí)。因而常使用一種與自相關(guān)函數(shù)有類似功效的另一參量,這就是短時(shí)平均幅差函數(shù)。它是基于下述這樣一個(gè)想法,即對(duì)于一個(gè)周期為 p的精確的周期輸入序列:

        d(n)=x(n)-x(n-k)(k=0,k=Np,k=-Np,k=2Np,k=-2Np,k=-2Np…)

        對(duì)于實(shí)際的語音信號(hào),上式雖不等于零,但亦有低谷。這些低谷將出現(xiàn)在整倍周期的位置上。因此,我們可以定義短時(shí)平均幅差 (AMDF) 如下:

        由于Fn(k)只需加法、減法和取絕對(duì)值的運(yùn)算 (矩形窗時(shí)),所以比自相關(guān)函數(shù)的計(jì)算大大節(jié)省了運(yùn)算量,尤其是硬件實(shí)現(xiàn)語音分析時(shí)得到很大的好處。

        濁音是周期信號(hào),濁音的短時(shí)自相關(guān)函數(shù)也呈現(xiàn)明顯的周期性,自相關(guān)函數(shù)的周期就是濁音信號(hào)的周期。清音接近于隨機(jī)噪聲,清音的短時(shí)自相關(guān)函數(shù)不具有周期性。根據(jù)這個(gè)性質(zhì)可以判斷一個(gè)語音信號(hào)是清音還是濁音,還可以判斷濁音的基音周期。

        2.3 基于短時(shí)平均幅度差函數(shù)(AMDF)的基音周期估計(jì)

        平均幅度差函數(shù)的定義為:

        算法具體如下:

        對(duì)于準(zhǔn)周期信號(hào),短時(shí)自相關(guān)函數(shù)在基音周期的各個(gè)整數(shù)倍點(diǎn)上有很大的峰值。如果我們所求得第一最大峰值點(diǎn)并計(jì)算其與零點(diǎn)的距離,該距離就是估計(jì)出來的基音周期。

        2.4 后處理

        沒有任何一種預(yù)測(cè)方法能夠準(zhǔn)確計(jì)算出所有的基音周期。往往大部分的點(diǎn)是比較準(zhǔn)

        確的,但是也有一部分的“野點(diǎn)”(通常偏離到標(biāo)準(zhǔn)值的兩倍或者一半),為此我們需要對(duì)預(yù)測(cè)結(jié)果進(jìn)行平滑處理。常用的平滑處理算法有中值平滑、線性平滑和組合平滑。

        中值平滑:對(duì)于被平滑的點(diǎn),我們?cè)谄鋬蓚?cè)各找M個(gè)點(diǎn),連同其自身共2M+1個(gè)點(diǎn)進(jìn)行排序,序列中間的那個(gè)點(diǎn)的值作為該點(diǎn)新的取值。中值平滑能去掉少量的野點(diǎn),同時(shí)也不會(huì)破壞基音曲線間的跳躍。

        線性平滑:平滑的方法是對(duì)周圍的點(diǎn)進(jìn)行線性加權(quán),設(shè)T為平滑的序列,現(xiàn)在準(zhǔn)備平滑第i個(gè)點(diǎn),那么T(i)=T(i-1)/4+T(i)/2+T(i+1)/4

        組合平滑:先對(duì)原始結(jié)果進(jìn)行一次中值平滑,然后對(duì)第一次平滑結(jié)果再進(jìn)行線性平滑。

        基于AMDF基音周期檢測(cè)的算法實(shí)現(xiàn):

        3 實(shí)驗(yàn)結(jié)果

        藏語■的采樣率為11025 HZ,聲道數(shù)為1,采樣精度為16位,數(shù)據(jù)長度為1245020字。

        藏語■(漢語為“春夏秋冬為四季”)的波形圖:

        藏語■(漢語為“春夏秋冬為四季”)的部分短時(shí)平均幅度圖:

        根據(jù)算法,得到藏語■(漢語為“春夏秋冬為四季”)的基頻值為:

        pitch =159.7826 HZ

        4 結(jié)束語

        通過采用基于AMDF的方法對(duì)基音周期的提取,能夠較準(zhǔn)確的得到藏語語音的基音周期,使其作為為語音合成、語音識(shí)別重要的參數(shù)之一。

        參考文獻(xiàn):

        [1] 拉賓納.語音信號(hào)數(shù)字處理[M].朱雪龍譯.科學(xué)出版社,1983

        [2] 韋健.采用有序?yàn)V波器進(jìn)行基音周期檢測(cè)[J].杭州大學(xué)學(xué)報(bào),1998,19(10):27-31.

        [3] 王艷芬,于洪珍,劉衛(wèi)東.基于時(shí)域自相關(guān)平方函數(shù)的基音周期估計(jì)[J].計(jì)算機(jī)工程與應(yīng)用,2004(31):83-85.

        [4] 張文耀,許剛,王裕國.循環(huán)AMDF及其語音周期檢測(cè)算法[J].電子學(xué)報(bào),2003,31(6):886.

        [5] 趙力.語音信號(hào)處理[M].機(jī)械工業(yè)出版社,2003.

        [6] Sondi M M.New methods of pitch extraction.IEEE T rans AU,1968,AU-16:262-266.

        色婷婷五月综合激情中文字幕| 国产伦理自拍视频在线观看| 亚洲桃色蜜桃av影院| 熟女体下毛荫荫黑森林| 免费a级毛片无码a∨男男| 国产婷婷丁香五月麻豆| 国产成人久久综合第一区| 免费看黄色亚洲一区久久| 中文字幕人妻少妇引诱隔壁| japanese无码中文字幕| 国产喷白浆精品一区二区| 久久一区二区三区少妇人妻| 国产乱子伦| 色狠狠色狠狠综合一区| 色老汉亚洲av影院天天精品| 丝袜美腿福利视频在线| 亚洲av日韩综合一区二区三区| 精品国产a∨无码一区二区三区| 无码高潮少妇毛多水多水免费| 一区二区二区三区亚洲| 人禽交 欧美 网站| 国产黄页网站在线观看免费视频 | 高潮毛片无遮挡高清视频播放| 少女高清影视在线观看动漫| 国产成人久久蜜一区二区| 日本一区二区三区在线视频播放 | 无码AV高潮喷水无码专区线| 最近中文字幕一区二区三区| 国产免费三级av在线| 超薄丝袜足j好爽在线观看| 国产精品九九久久一区hh| 中文字幕人妻av四季| 无码gogo大胆啪啪艺术| 亚洲va欧美va国产综合| 国产高清丝袜美腿视频在线观看| 91精品国产综合久久久密臀九色| 人妻av鲁丝一区二区三区| 中文人妻无码一区二区三区信息 | 国产一区二区三区天堂| 熟女精品视频一区二区三区| 亚洲日韩AV秘 无码一区二区|