亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基頻提取算法的研究與評價

        2012-10-20 08:35:48陳敏敏張云剛王智
        微型電腦應(yīng)用 2012年9期
        關(guān)鍵詞:信號效果

        陳敏敏,張云剛,王智

        0 引言

        通過對語音信號發(fā)聲過程的研究以及觀察記錄的各種語音波形,便可知道語音信號的頻率分量的分布范圍。如果用一個防混疊的帶通濾波器將此范圍內(nèi)的語音信號頻率分量取出,然后按某采樣率對語音信號進(jìn)行采樣,就可以得到離散時域的語音信號。近代語音系統(tǒng)中,為了實現(xiàn)更高質(zhì)量的語音編譯碼器或者使語音識別系統(tǒng)得到更好的識別率,將此頻率范圍擴展到 7-9kHz,采樣率從 8kHz提高到了15-20kHz。

        由于語音信號的準(zhǔn)平穩(wěn)特性,任何語音信號數(shù)字處理算法和技術(shù),都建立在“短時”的基礎(chǔ)上,在某些短時段中,它呈現(xiàn)出隨機噪聲的特性,另一些短時段則呈現(xiàn)出周期信號的特征,其它一些是二者的混合。即語音信號的特征是隨時間而變化的。只有在一短時間間隔中,語音信號才保持相對穩(wěn)定一致的特性,這段短時間一般可取為5—50ms。

        早在1951年,Licklider提出了一種自相關(guān)算法[1]去分析周期特性,但這種方法的復(fù)雜度是隨信號的采樣率的提高成平方增加的,為了提高精度增大采樣率,因此,算法的實現(xiàn)需要較好的硬件支持,同時,當(dāng)基頻超過幀長一半時,自相關(guān)法的精度會下降;為了避免短時自相關(guān)函數(shù)的乘法運算,1983年Hess[1]采用了一個簡單方法,用加減法和絕對值的運算,替換了自相關(guān)的乘法運算,設(shè)計了AMDF算法公式(1)

        雖然AMDF運算量遠(yuǎn)遠(yuǎn)小于自相關(guān)法,但AMDF算法中k值變化一大,判斷結(jié)果就不準(zhǔn)確。研究人員對上述進(jìn)行改進(jìn),產(chǎn)生了k變長的LV—AMDF算法,但對于周期性和平穩(wěn)性都較好的濁音語音段來說,該方法常會出現(xiàn)的第一周期谷點,并不是全局最低谷點,最低谷值點也不一定是基音周期所在點,在這種情況下,若以全局最低谷點作為基音周期計算點,就會產(chǎn)生嚴(yán)重的檢測錯誤[2]。

        語音的音頻提取有廣泛的應(yīng)用。它促進(jìn)了韻律學(xué)研究的發(fā)展;在語音識別中被用來識別原始的詞匯;一些音樂的應(yīng)用也需要基頻提取,比如多媒體內(nèi)容元數(shù)據(jù)的抽取,被用在自動評分和實時交互系統(tǒng)等等應(yīng)用上。但是大部分算法在可靠性上存在一定的缺陷和錯誤率,下面我們著重比較最近幾年主要的幾種基頻提取算法,具有篇幅有限,我們選用測試集51mike.com中許志安的《為什么你背著我愛別人》做原始的篩選。

        1 基頻提取算法比較

        1.1 Paul Boersma[3]提出了一種改進(jìn)了的自相關(guān)算法(kpitch),主要從兩個公式上進(jìn)行了改進(jìn)自相關(guān)算法。用原始的窗體信號的自相關(guān)變量 ra(t)除以窗體的自相關(guān)變量rw(t),得到新的rx(t)的預(yù)估值公式(2)

        在公式‘sin x / x’中補充延遲的部分,得公式(3)

        分別取窗大小τmax400和1000時,抽取《為什么你背著我愛別人》得到如下波形,如圖1、圖2所示:

        圖1 τmax=400時的kpitch音高提取結(jié)果

        圖2 τmax=1000時的kpitch音高提取結(jié)果

        從結(jié)果看出,歌曲具有較多的倍頻誤差,效果不是很理想。

        1.2 近年來,又有不少研究者改進(jìn)了原始的AMDF算法[4],并且和Viterbi算法[5]結(jié)合起來,來提取語音基音周期[4], 抽取我們的示例歌曲得到如下結(jié)果,如圖3所示:

        圖3 歸一化SMDSF、及分別加中值平滑、SViterbi后的效果

        歸一化 SMDSF 函數(shù)確定基音周期候選值, 定義狀態(tài)損失函數(shù)和轉(zhuǎn)移損失函數(shù), 進(jìn)而運用 Viterbi算法進(jìn)行基音周期提取, 比基準(zhǔn)系統(tǒng)基音周期提取的總錯誤率降低了 9.31%。其中, 使用 Viterbi 算法后處理的錯誤率,比使用 5點中值平滑方法后處理的總錯誤率降低了27.0%[6]??墒翘崛⌒Ч匀槐容^差。

        1.3 Anssi P.Klapuri[7]提出了一種基于諧波和頻譜平滑法來抽取多音信號的基頻的方法,稱做fxrapt算法,它分解出各個聲音的諧波,設(shè)計了一個頻譜平滑的算法,迭代的從混合的聲音中去掉每個探測到的聲音,直至剩下干凈的聲音為止。有明顯的倍頻、半頻誤差,效果也不是很理想。測試示例歌曲,效果如圖4所示:

        圖4 klapuri的基音提取算法

        1.4 Alain de Cheveigne[8]進(jìn)一步改進(jìn)了自相關(guān)算法,提出了一種Yin算法,主要從5個方面改進(jìn)了原始的自相關(guān)算法,先用一個新的函數(shù)替換了自相關(guān)函數(shù);然后通過把短延時值平均后,重新規(guī)范化每一個原始值;設(shè)置一個絕對的閥門,防止取到錯誤的點;用拋物中值法,解決非整數(shù)周期的情況;最后在附近區(qū)域選擇最好的估計值。該方法具有低延遲并且擁有極低的錯誤率,測試示例歌曲,效果如圖5所示:

        圖5 yin acf算法提取效果

        同樣《把根留住》也具有較低的錯誤率。我們用51mike.com歌庫做測試集,定義凡是抽取的音高估計值超過實際值20%的為嚴(yán)重錯誤,最終嚴(yán)重錯誤率在1%左右,具有較好的效果,Yin算法比上其他幾個算法錯誤率,都至少降低了60%以上。

        2 結(jié)論

        經(jīng)過詳細(xì)的比較,Yin算法在各類音高提取中具有最低的錯誤率,其他的幾個算法都比Yin算法錯誤率高出不少,我們同樣用51mile.com的曲庫做樣本集,經(jīng)過不少高水平歌手的反復(fù)運用,均取到了良好的反饋和效果。唯一不足的是,Yin算法雖然多從方面修正了原始的自相關(guān)算法,極大的了提高了提取音高的準(zhǔn)確性,但是經(jīng)過數(shù)次修正,該算法計算效率相比其他算法有點低,一些早期的機器運算起來稍微有點卡,但是當(dāng)前目前主流的PC,都不影響用戶體驗。

        [1]Li hui, Dai Beiqian, Lu Wei.A pitch detectionalg or ithm based on AMDF and ACF[ C ].Proceedings of ICASSP.Beijing:Dig ital Object Identifier,14-19, 2006

        [2]成新民等.一種改進(jìn)的 AMDF求取語音基音的方法[J].微電子學(xué)與計算機,2005,(22).

        [3]Boersma P.Accurate short-term analysis of the fundamental frequency and the harmonics-to-noise ratio of a sample sound.[j]Institute of Phonetic Sciences, University of Amsterdam, Proceedings.1993;(17): 97-110.

        [4]Shahidur M.Rahman, Hirobumi Tanaka, Tetsuya Shimamura ."Pitch Determination Using Aligned AMDF".ICSLP Ninth International Conference on Spoken Language Processing Pittsburgh, [M]PA, USA September 17-21, 2006

        [5]Gambino P.M.B.and Burnett.I.S.Low Delay Pitch Detection Using Dynamic-programming/viterbi Techniques.ISSPA, [M]Gold Coast, Australia, 25-30 August,1996.

        [6]劉建,鄭方,吳文虎.基于幅度差平方和函數(shù)的基音周期提取算法[J].清華大學(xué)學(xué)報.2006, Vo l.46, No.1:74-77

        [7]Klapuri, A.P.“Multiple fundamental frequency estimation based on harmonicity and spectralsmoothness,” IEEE[j]Trans.Speech and Audio Proc., 2003, 11(6), 804-816.

        [8]Alain de Cheveigne, Hideki Kawahara.YIN, a fundamental frequency estimator for speech and music[J].J.Acoust.Soc.Am.111 (4) 1917-1930, April 2002

        猜你喜歡
        信號效果
        按摩效果確有理論依據(jù)
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        完形填空二則
        迅速制造慢門虛化效果
        孩子停止長個的信號
        抓住“瞬間性”效果
        中華詩詞(2018年11期)2018-03-26 06:41:34
        模擬百種唇妝效果
        Coco薇(2016年8期)2016-10-09 02:11:50
        基于LabVIEW的力加載信號采集與PID控制
        一種基于極大似然估計的信號盲抽取算法
        3D—DSA與3D—CTA成像在顱內(nèi)動脈瘤早期診斷中的應(yīng)用效果比較
        国产av自拍视频在线观看| 亚洲国产AⅤ精品一区二区久 | 国内精品久久人妻互换| 国产女人精品一区二区三区| 欧美巨鞭大战丰满少妇| 午夜理论片yy44880影院| 乱码午夜-极国产极内射 | 国产男女猛烈无遮挡免费视频网址| 日本不卡视频一区二区| 亚洲综合色区一区二区三区| 日韩人妻无码精品久久| 亚洲有码转帖| 国产一区二区三区小说| 亚洲欧洲无码精品ⅤA| 国产人妖一区二区av| 日本一区二区三区不卡在线| 可以免费看亚洲av的网站| 亚洲av最新在线网址| 国产精品自产拍在线18禁| 久久熟女精品—区二区蜜臀| 成人影院在线视频免费观看| 免费无码黄动漫在线观看| 中文字幕在线免费| 久久99精品这里精品动漫6| 国产精品久久婷婷六月| 国产精品一区二区性色| 中文字幕人妻熟女人妻洋洋| 国产在线欧美日韩一区二区| 五月婷婷丁香视频在线观看| 国产电影无码午夜在线播放| 国产精品沙发午睡系列990531| 调教在线播放黄| 白色白在线观看免费2| 中国美女a级毛片| 亚洲日韩精品国产一区二区三区| 亚洲中文字幕不卡无码| 一区二区三区四区中文字幕av | 免费无码又黄又爽又刺激| 国产成人无码A区在线观| 国产精品高清免费在线| 无码人妻h动漫中文字幕|