【摘要】搜索和組織發(fā)展的數(shù)字音頻收藏需要音頻的自動分類。本文建立基于第二代小波變換和二階非齊次隱馬爾可夫(OSGWT-SNHMM)模型的新組合模型。提出了一種將第二代小波變換和離散隱馬爾可夫模型相結合的音頻分類方法。
【關鍵詞】音頻分類;第二代小波變換(OSGWT);二階非齊次隱馬爾可夫模型(SNHMM)
為了組織和搜索越來越多的音樂收藏,我們需要自動化的工具,可以從音頻直接提取有用的信息有關的歌曲。此類信息可能包括體裁,語氣,風格,和演員。近幾年,音頻分類得到了越來越多的專家學者的關注[1-6]。但傳統(tǒng)方法中,有的直接對小波變換的結果進行矢量量化,這樣就可能導致特征序列過長,使得計算量增大,以至于其收斂性和分類準確性都受到影響,有的忽略了文本上下文特征等信息對抽取性能的作用以及狀態(tài)轉移概率和觀察值輸出概率與模型歷史狀態(tài)的關聯(lián)性。
受文獻[1-6]的啟發(fā),為了解決以上所述缺點,本文首先建立一種基于第二代小波變換和二階非齊次隱馬爾可夫(OSGWT-SNHMM)模型的新組合模型,該模型克服原來模型導致特征序列過長計算量增大收斂性和分類準確性降低的問題,又能考慮文本上下文特征等信息對抽取性能的作用以及狀態(tài)轉移概率和觀察值輸出概率與模型歷史狀態(tài)的關聯(lián)性。二階非齊次隱馬爾可夫模型對錯誤信息有更強的識別能力,其性能好于傳統(tǒng)的隱馬爾可夫模型。該模型首先使用第二代小波變換對音頻特征進行時頻分析,給出了一種基于模極大值的小波變換后處理方法,用以提取分析結果中音頻特征的模極大值,將這些模極大值組成音頻特征量組,經(jīng)矢量量化后得到特征序列,然后將特征序列輸入到由二階非齊次隱馬爾可夫模型構建的分類系統(tǒng)中,實現(xiàn)對音頻的分類。
一、第二代小波變換
二、二階非齊次隱馬爾可夫模型(SNHMM)
在非齊次隱馬爾可夫模型(NHMM)中,計算狀態(tài)轉移概率時,假設狀態(tài)序列中的每一個狀態(tài)只與前一個狀態(tài)有關;計算觀察值的輸出概率時,假設任意時刻觀察輸出概率只依賴于系統(tǒng)當前時刻所處的狀態(tài),這里我們建立一種二階非齊次隱馬爾可夫模型(SNHMM)。與一階非齊次隱馬爾可夫模型不同的是,二階非齊次隱馬爾可夫模型(SNHMM)滿足下面假設條件
(B1)隱藏的狀態(tài)序列是一個二階馬爾可夫鏈。
(B2)輸出概率,不僅依賴于系統(tǒng)當前所處的狀態(tài),同時依賴于系統(tǒng)前一時刻所處的狀態(tài)。
三、仿真結果
本文采用 Matlab 生成擾動信號,長 度 為 2.1 s,其中包括 30個純語音 、34個音樂 、26個環(huán)境音。提取小波域特征并使用二階非齊次隱馬爾可夫算法,對音頻分類,得到了用分類精度表示的分類結果。
參考文獻
[1] 盧堅,陳毅松,孫正興.基于隱馬爾可夫模型的音頻自動分類[J].軟件學報,2002,13(8):1593—1597。
[2] 王超,吳亞鋒.基于 EMGD—HMM的音頻自動分類[J].電聲技術,2007,11:52-54。
[3] 史東承,韓玲艷,于明會?;贖MM/SVM的音頻自動分類[J].長春工業(yè)大學學報(自然科學版) ,2008,29(2):178-182。
[4] 齊俊英,孫勁光, 高愛東?;趦?nèi)容的音頻自動分類方法[J].遼寧工程技術大學學報,2005,24:170-172.
[5] 張新彩,張德同,耿國華,王小鳳,吳江。基于PCA和CHMM的音頻自動分類[J].計算機應用研究,2009,26(4):1257-1259.
[6] 楊靚,苗振江。WEB音頻自動分類的研究[J].第十一屆全國人機語音通訊學術會議。
作者簡介:趙芳(1976—),女,單位:山東省淄博市張店區(qū)馬尚鎮(zhèn)中心學校,研究方向:音樂學。