摘要:針對語音信號對比問題,提出了特征參數(shù)提取和基于余弦定理的向量相似度分析方法。將不同時刻的瞬時頻率及其瞬時頻率對應的幅值這兩個特征參數(shù)提取放到兩個向量中,利用余弦定理求出兩個向量夾角的余弦值作為相似度判定依據(jù),從而根據(jù)兩個特征向量的相似度求出兩個音頻信號的相似性。
關(guān)鍵詞:短時傅里葉變換;瞬時頻率估計;特征向量;向量相似度;MATLAB仿真
引言
現(xiàn)如今,與音頻信號比對相關(guān)的信號處理方法數(shù)不勝數(shù),英語打分軟件,K歌打分軟件都用到了語音比對原理,本文將最大幅度、瞬時頻率作為相似性原理估計的兩個特征值,從而完成語音比對任務。
傅里葉變換方法作為一種全局的線性處理方法【2】,反映了信號在整段時間內(nèi)的頻譜信息,只適用于平穩(wěn)信號的精確分析,無法滿足頻譜結(jié)構(gòu)隨時間變化的非平穩(wěn)信號的分析。語音信號是典型的非平穩(wěn)信號,針對語音信號的分析處理,用時頻聯(lián)合分析的方法可以揭示信號的時頻細節(jié),從而更準確的對其進行分析與處理。目前,時頻信號的分析處理已經(jīng)廣泛應用于物理、天文學、化學、生物學、醫(yī)學和通信等眾多領(lǐng)域。時頻分析在信號處理領(lǐng)域顯示出的巨大潛力,吸引著越來越多的人去研究并利用它。
1 短時傅里葉變換
STFT思想是:選擇一個時頻局部化的窗函數(shù),假定分析窗函數(shù)g(t)在一個短時間間隔內(nèi)是平穩(wěn)(偽平穩(wěn))的,移動窗函數(shù),使f(t)g(t)在不同的有限時間寬度內(nèi)是平穩(wěn)信號,從而計算出各個不同時刻的功率譜。短時傅里葉變換使用一個固定的窗函數(shù),窗函數(shù)一旦確定了以后,其形狀就不再發(fā)生改變。
STFT定義是:
式中【3】, 表示時間窗函數(shù),上標“*”表示復共軛。從式①中可看出:對于特定的時刻t,STFT是信號 與中心在 t的平滑移動窗函數(shù) 乘積的傅里葉變換。從這個意義上,STFT可以理解為信號 在分析時刻t的局部頻譜。由于分析窗的作用,在分析窗以外的信號得到抑制。
2 瞬時頻率估計方法
估計瞬時頻率屬于時變信號分析的問題,在時頻結(jié)果基礎上,通過比較每一局部時間段上隨頻率變化的幅度、能量或密度的大小,可以獲得對應每一局部時間段上最大幅度、能量或密度的頻率值,文中所采用的估計瞬時頻率的方法就是將此局部時間內(nèi)對應的最大幅度的頻率作為信號瞬時頻率的估計值。
3 基于特征向量的相似度估計
本文相似度估計所用方法是:構(gòu)造特征向量,將求取語音信號的相似度轉(zhuǎn)化成求取特征向量的相似性。
向量相似性求取原理:
上圖是一個二維向量的幾何表示。其中有二維向量a和b。θ就是這兩個二維向量的夾角;如果夾角為0度,意味著方向相同、線段重合;如果夾角為90度,意味著形成直角,方向完全不相似;如果夾角為180度,意味著方向正好相反。因此,我們可以通過夾角的大小,來判斷向量的相似程度。夾角越小,就代表越相似。
由資料【4】查閱,可得基于余弦定理的相似性估計公式為:
本實驗選取兩個參數(shù)作為特征參數(shù):1.瞬時頻率向量2.瞬時頻率對應的幅值向量。根據(jù)以上向量相似性估計原理可設定本實驗相似性判定條件:兩個特征參數(shù)的cosθ都小于0.6,判定不相似。兩個特征參數(shù)的cosθ都大于0.6且小于0.7,判定相似性為60%,兩個特征參數(shù)的cosθ都大于0.7且小于0.8,判定相似性70%,兩個特征參數(shù)的cosθ都大于0.8且小于0.9,判定相似性為80%,兩個特征參數(shù)的cosθ都大于0.9且小于1,判定相似性為90%,兩個特征參數(shù)的cosθ都等于1,判定相似性為100%。
由于兩個語音信號一般情況下維度不同,若進行截取,則會發(fā)生頻譜泄露。故在代碼中利用補零方法解決了兩個語音信號不同維度,無法進行處理的問題,仿真效果較好。
5 MATLAB編程思想
音頻信號相似性判定:
找一對相似的語音信號,如英文單詞LIVE和LOVE。分別對兩個語音信號進行短時傅里葉變換(STFT),然后找出兩個英文單詞最大幅度時對應的瞬時頻率,并將這些數(shù)據(jù)(瞬時頻率及瞬時頻率對應的最大幅度)分別存放到對應的數(shù)組中。將這兩類數(shù)據(jù)轉(zhuǎn)化為向量A和B,如:LIVE對應向量為A1、B1,LOVE對應向量為A2,B2。利用余弦定理的相似性原理,列出判定條件,即可判斷LIVE和LOVE的相似性。利用此編程思想可判定兩語音信號的相似性。
6 仿真驗證
信號相似性對比
圖一圖二對比,可知兩個信號不相似,但是MATLAB的出來的結(jié)論與信號時域圖對比得出來的結(jié)論相同,可知本實驗信號相似性判定原理與程序都是正確的。
7 結(jié)束語
利用短時傅里葉變換可進行各種時頻分析。其中信號相似性判定可由多種方法求出。本實驗利用基于余弦定理的特征向量相似性原理來判定兩個信號的相似性,本實驗程序由本作者完全自主編寫而成,若經(jīng)過語音包進行檢測后,則具有實際工程參考價值。
本實驗存在的問題是實驗數(shù)據(jù)量有待增加,后續(xù)需要進行更多數(shù)據(jù)的檢測。
參考文獻
[1]趙立昕,蔡志堅,周正.超寬帶信號的時頻分析[J].高技術(shù)通訊,2006,16(2):1332135.
[2]吳軍.數(shù)學之美.北京:人民郵電出版社2012,5(2):9787115282828.
作者簡介:陳淑杰(1999.02-),女,河南省駐馬店市人,職稱:學生,單位:鄭州大學信息工程學院,專業(yè):通信工程。