亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于SVM的錄音設備分類研究

        2016-10-11 09:15:27杜狀狀高沖紅童茜雯
        無線電通信技術(shù) 2016年5期
        關鍵詞:分類設備方法

        叢 韞,杜狀狀,高沖紅,童茜雯,鄭 義,仲 倩

        (南京工程學院 通信工程學院,江蘇 南京 211167)

        ?

        基于SVM的錄音設備分類研究

        叢韞,杜狀狀,高沖紅,童茜雯,鄭義,仲倩

        (南京工程學院 通信工程學院,江蘇 南京 211167)

        為解決音頻取證中私錄音頻由何種錄音設備所錄的問題,針對不同設備所采用的壓縮算法不同,就會導致錄音信號中蘊含著區(qū)別于其他錄音設備的個性特征,本文從壓縮算法出發(fā),提出了一種基于SVM對錄音設備的分類方法。首先獲取不同錄音格式的音頻,然后針對音頻分別用MATLAB對其求改進MFCC倒譜參數(shù),接著選定測試集和訓練集,使用交叉驗證方法得到倒譜數(shù)據(jù)的最佳參數(shù),之后用訓練集對SVM進行訓練,再用得到的模型來預測測試集的分類標簽。通過仿真與實驗,結(jié)果表明,該方法能夠較好的區(qū)分不同壓縮算法下的音頻特性,平均識別率達97%。

        音頻取證;壓縮算法;改進MFCC;SVM;交叉驗證

        0 引言

        隨著數(shù)字媒體技術(shù)在日常生活中的使用和普及,國內(nèi)外音頻證據(jù)在法庭證據(jù)、案件調(diào)查中出現(xiàn)的次數(shù)越來越多,所占比重也越來越大。錄音的來源往往是首先會關注的問題,尤其是錄音文件由何種錄音設備錄制,這是錄音文件具有合法性的前提。由于錄音設備種類繁多,而且在錄制過程中易受到環(huán)境和說話人特征的影響,國際上對錄音設備識別的研究還較少。在國外,Kraetzer、Bucholz等人和Garcia-Romera以及Espy-Wilson、Malik、Cemal對這方面展開了研究,國內(nèi)南京大學聲學所、司法部司法鑒定科學技術(shù)研究所也對此展開了研究。以上這些研究,并未從算法出發(fā)分析錄音設備的內(nèi)在特征。本文從壓縮算法出發(fā),提出了一種基于SVM的錄音設備分類方法,在解決音頻取證中對錄音設備的識別研究提供了方向,值得進一步深入探索。

        1 特征提取方法

        音頻信號采用改進MFCC進行分析處理,具體步驟如圖1所示。對信號進行預處理,分幀、加窗,一般設一段語音存在X中,X長為N,采樣頻率Fs,幀長L,后一幀對前一幀位移量S,則將長為N的語音信號進行分幀,如式(1)所示:

        Fn=(N-L)/S+1,

        (1)

        式中,x(m)為語音信號,w(m)為單位沖擊響應,n為整數(shù)。

        加窗實際上就是乘以一個窗函數(shù),窗函數(shù)如式(2)所示,在分幀時會有一定程度的幀移,加窗是為了增強連續(xù)性,然后進行FFT快速傅里葉變換,得到每幀信號的頻譜。式(2)求平方,得到每幀信號的功率譜:

        (2)

        圖1 提取改進MFCC的方案

        根據(jù)每個通道的截止頻率截取Mel頻率尺度對Mel濾波器組進行歸一化,然后對Mel組進行歸一化,并對Mel濾波器組的輸出數(shù)據(jù)進行歸一化。將Mel濾波器組的輸出數(shù)據(jù)變換到對數(shù)域,再作離散余弦變換得到MFCC參數(shù),結(jié)果如式(3)所示。式中N為三角濾波器個數(shù),Xk為第K個濾波器的輸出,Ci即為所求的MFCC參數(shù),P為其階數(shù)。

        (3)

        2 分類方法

        2.1支持向量機基本原理

        支持向量機的主要思想是建立一個分類超平面作為決策平面,使得正例與反例之間的隔離邊緣被最大化。支持向量機的理論基礎是統(tǒng)計學習理論,更精確地說,支持向量機是結(jié)構(gòu)風險最小化的近似實現(xiàn)。這個原理基于這樣的事實:學習機器在測試數(shù)據(jù)上的誤差率(即泛化誤差率)以訓練誤差率和一個依賴于VC維數(shù)(Vapnik-Chervonenkis dimension)的項的和為界,在可分模式情況下,支持向量機對于前一項的值為零,并且使第二項最小化。因此,盡管它不利用問題的領域內(nèi)部問題,但在模式分類問題上支持向量機能提供好的泛化性能,這個屬性是支撐向量機特有的。

        支持向量機經(jīng)歷了從二維分類到多維分類的發(fā)展過程,多維分類原理十分復雜,但是原理與二維分類原理相似,因此可以用線性可分的情況進行說明,基本思想如圖2所示。假設圖中有兩類樣本,分別用實心點和空心點表示;H代表將兩類樣本最大程度間隔開的分類線;H1、H2分別為過各類中離分類線最近的樣本,且平行于分類線的直線,它們之間的間隔叫做分類間隔。所謂最優(yōu)分類線,就是要求分類線不但能將兩類正確分開,而且使分類間隔最大。引申到高維度分類問題中,能夠以最大間隔、最大限度分離兩類樣本的超平面就是最優(yōu)超平面。

        圖2 分類平面示意圖

        支持向量機的體系結(jié)構(gòu)如圖3所示,其中x(i)為支持向量,x為輸入空間抽取的向量,K為核函數(shù),其種類主要有:① 線性核函數(shù)(Linear):K(x,xi)=xTxi;② 多項式核函數(shù)(Polynomial):K(x,xi)=(γxTxi+r)p,γ>0;③ 徑向基核函數(shù)(Radial basis function):K(x,xi)=exp(-γ||x-xi||2),γ>0;④ S形函數(shù)(sigmoid):K(x,xi)=tanh(γxTxi+r)d。

        圖3 支持向量機的體系結(jié)構(gòu)

        2.2SVM模型構(gòu)造

        SVM模型建立首先需要從原始數(shù)據(jù)里把訓練集和測試集提取出來,進行一定的預處理,之后用訓練集對SVM進行訓練,再用得到的模型來預測測試集的分類標簽,算法流程圖如圖4所示。

        圖4 模型總體流程

        2.2.1選定測試集和訓練集

        本文選取總樣本數(shù)的4/5作為訓練樣本集,數(shù)據(jù)預處理后通過多次訓練求得支持向量并構(gòu)造SVM模型,其余1/5作為測試樣本集,通過代入SVM模型檢驗對測試樣本的分類正確率,即模型的泛化能力。

        2.2.2數(shù)據(jù)預處理

        樣本數(shù)據(jù)中包含的先驗信息會對分類器的性能測試結(jié)果與測試數(shù)據(jù)的實驗效果產(chǎn)生直接的影響,因此有必要對數(shù)據(jù)進行歸一化處理,采用的歸一化映射如下:

        式中,x,y∈Rn,xmin=min(x),xmax=max(x),歸一化的效果是原始數(shù)據(jù)被規(guī)整到[0,1]范圍內(nèi),即yi∈[0,1],i=1,2.……n,這種歸一化方式稱為[0,1]區(qū)間歸一化。

        2.2.3交叉驗證尋求最優(yōu)參數(shù)

        本文用SVM做分類預測時需要用到懲罰系數(shù)c和徑向基核函數(shù)參數(shù)g,采用LIBSVM3.20工具包使用交叉驗證的方法尋求最優(yōu)參數(shù),以得到比較理想的預測分類正確率。交叉驗證是用來驗證分類器性能的一種統(tǒng)計分析方法,基本思想是在某種意義下將原始數(shù)據(jù)進行分組,一部分作為訓練集,另一部分作為驗證集。其方法是首先用訓練集對分類器進行訓練,再利用驗證集來測試訓練得到的模型,以得到的分類準確率作為評價分類器的性能指標。采用交叉驗證的思想,可以有效地避免過學習和欠學習狀態(tài)的發(fā)生,最終對于測試集合的預測得到較理想的正確率。

        3 測試方案

        3.1數(shù)據(jù)采集

        本實驗收集了10種不同的語音,手機設備和具體錄音格式如下:華為:m4a;oppo:wav、mp3和amr;三星:amr和m4a;魅族:mp3;小米:mp3;vivo:3gpp;聯(lián)想:ogg;每個手機設備錄一段音頻,每段音頻60s左右。

        3.2實驗結(jié)果與分析

        對于改進MFCC的提取方案如圖1所示,具體表達式如式(3)所示。下面以小米手機為例展開說明,將小米手機錄的語音信號導入到PC端通過matlab進行處理,進行分幀、加窗,幀長為400ms,幀移為260ms,窗函數(shù)采用漢寧窗,提取500組24維的改進MFCC特征參數(shù),圖5為提取的MFCC倒譜圖。

        在提取的5 000個樣本中,其中1~500屬于第1類(類別標簽為1),501~1000為第2類(類別標簽為2),1001~1500為第3類(類別標簽為3),以此類推,4501~5000為第10類,現(xiàn)將每個類別分為2組,重新組合數(shù)據(jù),一部分作為訓練集,一部分作為測試集。通過交叉檢驗的方法獲得最佳參數(shù)為c=2.2974,g=4,參數(shù)選擇結(jié)果圖如圖6所示,x軸表示c取以2為底的對數(shù)后的值,y軸表示g取以2為底的對數(shù)后的值,等高線表示取相應的c和g后對應的CV方法的準確率。3D視圖如圖7所示。

        圖5 小米手機倒譜圖

        圖6 參數(shù)選擇結(jié)果圖(等高線圖)

        圖7 參數(shù)選擇結(jié)果圖(3D視圖)

        運用上文選擇的最優(yōu)化參數(shù)對測試樣本進行預測,即選用c=2.297 4,g=4,基于訓練樣本數(shù)據(jù)train_data提取相應的標簽train_data_labels建立模型svmtrain,系統(tǒng)的輸出結(jié)果如下所示:

        optimization finished,#iter=192

        nu=0.033 472

        obj=-12.648 015,rho=-0.445 306,

        nSV=52,nBSV=10,

        Total nSV=2 012,

        Accuracy=96.9% (969/1 000) (classfication)。

        接著對測試樣本進行預測,得到的分類正確率為97%,分類結(jié)果如圖8所示,即1 000個樣本中有31個樣本識別錯誤,因此基于SVM的錄音設備分類方法具有較高的準確率,能夠準確地識別出對應錄音格式的手機設備。

        圖8 測試集的分類結(jié)果圖

        4 結(jié)束語

        為解決音頻取證中私錄音頻由何種錄音設備所錄的問題,針對不同設備所采用的壓縮算法不同,就會導致錄音信號中蘊含著區(qū)別于其他錄音設備的個性特征,本文從壓縮算法出發(fā)介紹了一種基于SVM對錄音設備的分類方法,使用交叉驗證的方法獲得樣本數(shù)據(jù)最優(yōu)參數(shù),并給出了提取語音信號特征參數(shù)改進MFCC和構(gòu)建SVM模型進行訓練分類的具體流程,實驗測試過程中,該方法在準確性方面滿足一定的要求。綜合來看,本文的方法具有較好的參考價值。

        [1]Vapnik V.Statistical Learning Theory[M].New York:Wiley,1998.

        [2]Cortes C,Vapnik V.Support-Vector network[J].Machine Learning,1995,20:273-297.

        [3]Boser B,Guyon I,Vapnik V.ATraining Algorithm for Optional Margin Classifiers[C]//ACM press:In Proceeding of the Fifth Annual Workshop on Computerional Learning Theory,1992:144-152.

        [4]Hsu C W,Lin C J.AComparsion of Methods for Multi-class Support Vector Machines[J].IEEE Transactions on Neural Network ,2002,13(2):415-425.

        [5]Lin C J.Formulations ofSupport Vector Machines:a Note from an Optimization Point of View[J].Neu-ral Computation,2001,13(2):307-317.

        [6]張慶,劉丙杰.基于PSO和分組訓練的SVM參數(shù)快速優(yōu)化方法[J].科學技術(shù)與工程,2008,8(16):4613-4616.

        [7]楊杰,鄭 寧,劉 董,等.基于遺傳算法的SVM帶權(quán)特征和模型參數(shù)優(yōu)化[J].計算機仿真,2008,25(9):113-118.

        [8]張小艷,李 強.基于SVM的分類方法綜述[J].科技信息,2008(28):344-345.

        [9]范昕煒,杜數(shù)新,吳鐵軍.粗SVM分類方法及其在污水處理過程中的應用[J].控制與決策,2004,19(5):573-576.

        [10]陳光英,張千里,李 星.基于SVM分類機的入侵檢測系統(tǒng)[J].通信學報,2002,23(5):51-56.

        [11]雷英杰,張善文,李續(xù)武,等.MATLAB工具箱及應用[M].西安:西安電子科技大學出版社,2005.

        [12]張雪英.數(shù)字信號處理與MATLAB仿真[M].北京:電子工業(yè)出版社,2010.

        Recording Equipment Classification Study Based on SVM

        CONG Yun,DU Zhuang-zhuang,GAO Chong-hong,TONG Qian-wen,ZHENG Yi,ZHONG Qian

        (School of Communication Engineering,Nanjing Institute of Technology,Nanjing Jiangsu 211167,China)

        To solve the problem of which kind of recording equipment is used for private audio recorded in audio forensic,the article presents a classification method for recording equipment based on SVM embarking from the compression algorithm,which is based on the fact that the recorded signals from different devices with different compression algorithms contain personality characteristics different from other recording devices.Audios in different format are collected at first.Then its improved MFCCs are extracted respectively by MATLAB and testing and training sets are selected.Then Cross Validation method is used to get the optimal parameters of cepstrum data.The SVM is trained with the training set and the classification label of the testing set is predicted with the model obtained.The simulation and test results show that the method can distinguish audio features among different compression algorithms better,and the average recognition rate is 97%.

        audio forensic;compression algorithm;improved MFCC;SVM;Cross Validation

        10.3969/j.issn.1003-3114.2016.05.17

        引用格式:叢韞,杜狀狀,高沖紅,等.基于SVM的錄音設備分類研究[J].無線電通信技術(shù),2016,42(5):68-70,84.

        2016-05-09

        江蘇省大學生創(chuàng)新創(chuàng)業(yè)訓練項目(201511276004z)

        叢韞(1995—),女,本科,主要研究方向:信號與信息處理。仲倩(1995—),女,本科,主要研究方向:信號與信息處理。

        TN912.3

        A

        1003-3114(2016)05-68-3

        猜你喜歡
        分類設備方法
        諧響應分析在設備減振中的應用
        分類算一算
        分類討論求坐標
        基于MPU6050簡單控制設備
        電子制作(2018年11期)2018-08-04 03:26:08
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        可能是方法不對
        500kV輸變電設備運行維護探討
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        欧美中文字幕在线| 国产天堂av在线一二三四| 狠狠躁夜夜躁av网站中文字幕| 久久视频在线| 巨大欧美黑人xxxxbbbb| 亚洲国产AⅤ精品一区二区久| 国产av剧情精品麻豆| 国产aⅴ无码专区亚洲av| 女性女同性aⅴ免费观女性恋| 日韩欧美国产丝袜视频| 久久久精品国产亚洲av网不卡| 邻居美少妇张开腿让我爽了一夜| 激烈的性高湖波多野结衣| 亚洲中文字幕第一页在线| 国产av91在线播放| 青青草在线免费播放视频| 国产综合无码一区二区辣椒| 久久国产自偷自免费一区100| 色中文字幕视频在线观看| 变态另类手机版av天堂看网| 欧美黑人xxxx又粗又长| 国产成人无码A区在线观| 亚洲国产av午夜福利精品一区| 99精品视频69v精品视频免费| 亚洲一区二区三区在线高清中文| 欧美嫩交一区二区三区| 最新亚洲精品国偷自产在线| 亚洲色AV天天天天天天| 亚洲第一女人的天堂av| 国产精品亚洲综合色区| 久久国产偷| 午夜婷婷国产麻豆精品 | 久久国产精品男人的天堂av| 精品露脸熟女区一粉嫩av| 亚洲人成网站18禁止| 一本大道久久东京热无码av| av手机在线天堂网| 国产免费一区二区在线视频| 久久精品人妻无码一区二区三区| 亚洲国产午夜精品乱码| 亚洲精品视频一区二区三区四区|