亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于Matlab的聽音識曲系統(tǒng)的設(shè)計與實現(xiàn)

        2021-07-12 08:35:46徐清釧趙彥鈞張丹露
        科技視界 2021年18期
        關(guān)鍵詞:聽音錄音指紋

        徐清釧 趙彥鈞 張丹露 弓 創(chuàng) 楊 光

        (黃河科技學(xué)院,河南 鄭州 450000)

        0 引言

        隨著信息時代的發(fā)展,語音識別技術(shù)在生活中的應(yīng)用越來越廣泛,國內(nèi)有很多機構(gòu)都在研究這方面的工作?!奥犚糇R曲”研究是當(dāng)前的熱門領(lǐng)域,本文通過研究原有的聽音識曲系統(tǒng),掌握識別的基本原理,并使用Matlab程序搭建一個簡易的聽音識曲系統(tǒng)。

        1 系統(tǒng)整體架構(gòu)

        整體流程分是:運行GUI界面,然后擇曲庫的路徑導(dǎo)入曲庫,在導(dǎo)入曲庫后可以選擇識別方式,最后點擊開始識別等待識別輸出結(jié)果即可。圖1即為整體流程。

        圖1 整體流程

        2 音頻指紋提取

        整個提取的過程是:添加曲庫的音樂文件、對轉(zhuǎn)換過格式的文件進行預(yù)加重、分幀、加窗、快速傅里葉變換、梅爾濾波器設(shè)計、輸出梅爾系數(shù)。音頻指紋提取整體流程如圖2所示。

        圖2 音頻指紋提取整體流程

        2.1 分幀加窗

        音頻信號處理之前要進行截短處理[7],通過函數(shù)來完成分幀效果。

        加窗分幀操作通過窗函數(shù)實現(xiàn),每移動一次窗函數(shù)就得到一幀的音樂片段。把音頻段分割成大小為20 ms的幀,音樂片段之間需要重疊1/3,并使用相同長度的窗函數(shù)對每一幀平滑處理。時域波形和頻譜圖如3所示。

        圖3 時域波形和頻譜圖

        本系統(tǒng)使用漢寧窗,用ωN(n)表示窗函數(shù),用N表示窗函數(shù)的長度,其表達式如式(1)所示:

        2.2 音頻指紋劃分

        將經(jīng)過FFT變換的音頻信號,按照幀長、幀移和峰值幅度進行分幀,每一幀都是音頻指紋的特征,將其劃分為30個不同的子代可以更好更準確地提取指紋信息。若音頻匹配比較粗糙的話,可以分割更多幀長,以達到后期更好的匹配效果。音頻指紋劃分的公式如式(2)所示:

        式中,F(xiàn)min為最小頻率值,即310Hz,F(xiàn)max為最大頻率值,即2100 Hz,M表示子帶個數(shù),f(m)表示第m子帶的起始頻率,同時也是第m-1子帶的終止頻率。

        2.3 MFCC算法原理

        梅爾倒譜系數(shù)[6],這個參數(shù)的計算首先就要對語音信號通過一個高通濾波器預(yù)加重處理,然后對音頻信號進行分幀,以及梅爾濾波器、窗函數(shù)的設(shè)計和傅里葉變換的應(yīng)用。

        3 音頻識別算法

        3.1 DTW算法應(yīng)用

        待識別片段與曲庫中的音樂片段絕大多數(shù)不一致,一首完整的音樂大概300 s,而識別過程中,識別過程在15 s左右,兩段音頻長度不同,因此在一定程度上需要特殊的算法,對特征參數(shù)序列(見圖4)重新進行時間的校準。所以可以選用DTW算法[3]。

        圖4 特征參數(shù)序列

        3.2 最小似然距離擬合匹配

        此擬合算法首先生成一個i×j的矩陣,i是矩陣的行數(shù),j是矩陣的列數(shù),人們稱它為似然距離,用p表示,似然系數(shù)用q表示,因為系數(shù)矩陣的特征值具有獨特性,所以每一幀音頻的似然系數(shù)是不同的,分別對每一首待識別的音頻進行計算,求出似然系數(shù),并將與所建立音樂庫里的歌曲的似然系數(shù)值作差再取絕對值,能得到一個最小值,這個最小值就是最小似然距離(見圖5),并通過此算法篩選出這個最小值,它對應(yīng)的歌曲就是識別的結(jié)果。原理公式如式(3):

        圖5 最小似然距離

        式中,p為;q為;i為;j為。

        4 GUI界面設(shè)計

        GUI界面是該系統(tǒng)的操作界面(見圖6),可以根據(jù)界面上的文字提示來逐步完成對音樂的識別:打開MATLAB平臺,點擊運行即可。

        圖6 GUI界面

        點擊曲庫路徑按鈕,可以自行跳轉(zhuǎn)到所建立的音樂庫路徑,任意點擊音樂庫里的一首歌,可以將全部歌導(dǎo)入到檢索曲庫里。

        點擊選擇音樂,選擇一首待識別的音樂對該首音樂提取特征,生成索引值,與最初的模板庫里多個索引信息建立的索引庫進行匹配。

        5 歌曲識別率

        由于“聽歌識曲”系統(tǒng)主要針對歌曲進行設(shè)計,因此,隨機挑選出當(dāng)下較熱門的5首流行歌曲進行測試。為了避免誤差以及確保驗證系統(tǒng)的穩(wěn)定性,每首歌曲分別進行十次測試,記錄下正確次數(shù)并且取平均值,計算正確率,系統(tǒng)在音樂文件識別上的正確率可以達到100%,在錄音文件的識別上正確率達50%~60%。具體識別結(jié)果見表1、表2。

        表1 音樂文件識別率

        表2 錄音文件識別率

        6 結(jié)語

        本文所設(shè)計的“聽音識曲”系統(tǒng),可以幫助人們識別一首不知名的音樂片段,使人們不再為錯失一首好聽的音樂而煩惱。系統(tǒng)主要完成了將音頻信號轉(zhuǎn)化成音頻特征、樂庫的建立、特征匹配系統(tǒng)的搭建和GUI頁面的生成等工作;基本達到了預(yù)期的要求,能夠滿足人們的需要。當(dāng)然,系統(tǒng)在設(shè)計方面還存在一些缺陷,譬如說,通過錄音的方式進行識別的準確率還不夠高,如果需要提高準確率,還要用一些更專業(yè)的錄音設(shè)備和對濾波除噪聲算法進行更深層次的研究,對MFCC、DTW以及最小似然距離擬合匹配算法的優(yōu)化,減少其他噪聲的干擾;本文中的曲庫做得還不夠豐富,只有一少部分的音樂,能夠識別的樂曲有限。今后,可以從增加樂庫歌曲信息與反應(yīng)時間兩方面進行優(yōu)化,盡可能多地增加樂曲,盡可能少地縮短識別時間,盡量使用更加專業(yè)的錄音設(shè)備,將錄音識別方式識別歌曲的準確率上再做一些提升。

        猜你喜歡
        聽音錄音指紋
        Listen and Paint, etc.
        聽音識人
        Funny Phonics
        像偵探一樣提取指紋
        為什么每個人的指紋都不一樣
        由“聽音為字”看“戲”“?”“丫麻”
        Colorful Seasons多彩四季
        A New Term
        修訂版PEP 六年級英語畢業(yè)檢測題
        基于自適應(yīng)稀疏變換的指紋圖像壓縮
        亚洲国产a∨无码中文777| 色综合久久精品中文字幕| 成人免费丝袜美腿视频| av免费在线播放观看| 风韵丰满熟妇啪啪区老熟熟女| 国产情侣久久久久aⅴ免费| 久久人妻AV无码一区二区| 精品人妻夜夜爽一区二区| 国偷自拍av一区二区三区| 少妇太爽了在线观看免费视频| 日本免费人成视频播放| av资源在线播放网站| 午夜国产视频一区二区三区| 亚洲国产欧美日韩欧美特级| 日韩久久一级毛片| 有码中文字幕一区二区| 不卡的高清av一区二区三区| 一本一道波多野结衣av中文| 久久精品无码一区二区三区不| 亚洲视一区二区三区四区| 国产精品一区二区久久国产| 东京无码熟妇人妻av在线网址| 免费观看一区二区| 国产一区二区亚洲一区| 国产色系视频在线观看| a级黑人大硬长爽猛出猛进| 久久婷婷国产综合精品| 国产高潮流白浆视频在线观看| 国产又粗又黄又爽的大片| 国产视频导航| 亚洲产在线精品亚洲第一页| 亚洲综合另类小说色区| 人妻丰满熟妇av无码区免| 成人国产在线观看高清不卡| 女女同女同一区二区三区| 人妻无码一区二区不卡无码av| 亚洲精品国产字幕久久vr| 亚洲天堂一区二区三区视频| 亚洲av永久无码精品古装片| 无码夜色一区二区三区| 国产高清精品在线二区|