亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于信道模式噪聲的錄音回放攻擊檢測(cè)*

        2011-08-02 05:51:14王志鋒賀前華張雪源羅海宇蘇卓生
        關(guān)鍵詞:錄音信道語(yǔ)音

        王志鋒 賀前華 張雪源 羅海宇 蘇卓生

        (華南理工大學(xué)電子與信息學(xué)院,廣東廣州510640)

        隨著說(shuō)話人識(shí)別技術(shù)的不斷發(fā)展,說(shuō)話人識(shí)別系統(tǒng)在司法取證、電子商務(wù)、金融系統(tǒng)等領(lǐng)域得到了非常廣泛的應(yīng)用[1].與此同時(shí),說(shuō)話人識(shí)別系統(tǒng)所面臨的前端攻擊及傳輸存儲(chǔ)等的安全問(wèn)題制約了說(shuō)話人識(shí)別系統(tǒng)的發(fā)展和應(yīng)用.

        說(shuō)話人識(shí)別系統(tǒng)面臨的兩種常見(jiàn)攻擊是說(shuō)話人仿冒攻擊[2]和錄音回放攻擊[3].說(shuō)話人仿冒攻擊是指攻擊者通過(guò)模仿說(shuō)話人識(shí)別系統(tǒng)中用戶的聲音對(duì)系統(tǒng)進(jìn)行的攻擊.在雙胞胎語(yǔ)音庫(kù)上的說(shuō)話人識(shí)別實(shí)驗(yàn)表明,現(xiàn)有的說(shuō)話人識(shí)別技術(shù)能夠區(qū)分具有類似聲學(xué)特性的雙胞胎語(yǔ)音[4],因此實(shí)施說(shuō)話人仿冒攻擊需要有非常好的模仿技巧,使攻擊者的語(yǔ)音能夠和系統(tǒng)用戶的語(yǔ)音達(dá)到高度的相似,這使得仿冒攻擊的可實(shí)施性不高.錄音回放攻擊是指攻擊者事先用高保真錄音設(shè)備偷錄說(shuō)話人識(shí)別系統(tǒng)中用戶的語(yǔ)音,然后通過(guò)高保真功放在系統(tǒng)輸入端回放,以此對(duì)說(shuō)話人識(shí)別系統(tǒng)實(shí)施攻擊.與仿冒語(yǔ)音相比,錄音回放語(yǔ)音是真實(shí)來(lái)自于用戶本人,對(duì)說(shuō)話人識(shí)別系統(tǒng)造成的威脅更大.另外,現(xiàn)在性能好的高保真錄音及回放設(shè)備不斷涌現(xiàn),其價(jià)格越來(lái)越便宜,體積越來(lái)越小,便于攜帶不易被發(fā)現(xiàn),這使得錄音回放攻擊越來(lái)越容易實(shí)施.

        防止錄音回放攻擊的一種方法是通過(guò)系統(tǒng)隨機(jī)挑選語(yǔ)句讓用戶跟讀,在進(jìn)行說(shuō)話人識(shí)別的同時(shí)還要判斷用戶是否按要求來(lái)跟讀.這種方法的實(shí)施需要事先準(zhǔn)備豐富的語(yǔ)音庫(kù),并要求用戶按照語(yǔ)音內(nèi)容跟讀,當(dāng)用戶按照自己的習(xí)慣發(fā)音時(shí),將有可能通不過(guò)說(shuō)話人識(shí)別系統(tǒng)[5],而且這種方法會(huì)犧牲說(shuō)話人識(shí)別系統(tǒng)對(duì)于特定用戶特定文本的安全保護(hù)性,產(chǎn)生一些其它安全問(wèn)題[3].

        文獻(xiàn)[5]中以通用背景模型為基礎(chǔ),利用系統(tǒng)直接采集的用戶原始數(shù)據(jù)中的靜音段對(duì)信道進(jìn)行建模,檢測(cè)待識(shí)別語(yǔ)音與訓(xùn)練語(yǔ)音的信道是否相同.由于靜音段幅度很小,比語(yǔ)音段更容易受到噪聲污染,故靜音中信道信息很容易被噪聲掩蓋.此外,以大量說(shuō)話人的通用背景模型為基礎(chǔ),并不一定能夠訓(xùn)練出精確的信道模型.

        回放語(yǔ)音在進(jìn)入說(shuō)話人識(shí)別系統(tǒng)錄音信道前,還經(jīng)歷了一次錄音和一次回放的過(guò)程.不同的錄音和回放設(shè)備引入不同的信道噪聲(麥克風(fēng)、揚(yáng)聲器、抖動(dòng)電路、前置放大器、功率放大器、輸入和輸出濾波器、A/D、D/A、取樣保持電路等都會(huì)引入相應(yīng)的噪聲[6]),這些信道噪聲疊加在回放語(yǔ)音上,使得回放語(yǔ)音和原始語(yǔ)音存在細(xì)微的差異.文中將這些來(lái)自不同錄音與回放設(shè)備中換能器和不同電路引入的噪聲稱為信道模式噪聲.原始語(yǔ)音中含有系統(tǒng)錄音設(shè)備的信道模式噪聲,而回放語(yǔ)音中不僅含有系統(tǒng)的信道模式噪聲,還含有偷錄設(shè)備和回放設(shè)備的信道模式噪聲.為此,文中提出了一種通過(guò)提取原始語(yǔ)音和回放語(yǔ)音中的信道模式噪聲來(lái)檢測(cè)錄音回放攻擊的方法.

        1 錄音回放攻擊檢測(cè)系統(tǒng)

        基于信道模式噪聲的錄音回放攻擊檢測(cè)系統(tǒng)主要由5個(gè)部分組成:預(yù)處理、信道模式噪聲提取、長(zhǎng)時(shí)統(tǒng)計(jì)特征提取、基于支持向量機(jī)(SVM)的信道噪聲建模、原始語(yǔ)音和回放語(yǔ)音的分類識(shí)別,如圖1所示.

        圖1 基于信道模式噪聲的錄音回放攻擊檢測(cè)系統(tǒng)結(jié)構(gòu)Fig.1 Structure of playback attack detection system based on channel pattern noise

        根據(jù)錄音回放攻擊檢測(cè)模塊在說(shuō)話人識(shí)別系統(tǒng)中所處位置的不同,錄音回放攻擊檢測(cè)器可分為前端錄音回放攻擊檢測(cè)和后端錄音回放攻擊檢測(cè),如圖2所示.進(jìn)行前端回放攻擊檢測(cè)時(shí),輸入的用戶語(yǔ)音首先進(jìn)行回放攻擊檢測(cè),如果被判定為錄音回放語(yǔ)音,則系統(tǒng)可直接拒絕為攻擊語(yǔ)音提供服務(wù).對(duì)于前端回放檢測(cè),輸入語(yǔ)音可以來(lái)自系統(tǒng)中任意用戶,需要為所有用戶建立一個(gè)具有泛化能力且不被特定用戶所影響的回放攻擊檢測(cè)器.對(duì)于后端回放檢測(cè),用戶語(yǔ)音首先進(jìn)行說(shuō)話人識(shí)別,如果判定為合法用戶,則將其輸入到后端檢測(cè)器進(jìn)行回放攻擊檢測(cè).此時(shí),說(shuō)話人識(shí)別系統(tǒng)可為回放檢測(cè)器提供用戶信息,只需為單個(gè)用戶建立相應(yīng)的后端回放攻擊檢測(cè)器.

        圖2 具有防錄音回放攻擊功能的說(shuō)話人識(shí)別系統(tǒng)結(jié)構(gòu)Fig.2 Structure of speaker recognition system with playback attack detector

        1.1 基于統(tǒng)計(jì)幀的對(duì)數(shù)功率譜

        一般認(rèn)為,信道噪聲是均勻地作用在整個(gè)發(fā)音之上[7],不同錄音及回放設(shè)備的信道模式噪聲是和語(yǔ)音信號(hào)同時(shí)產(chǎn)生的.因此,考慮采用具有統(tǒng)計(jì)意義的長(zhǎng)時(shí)特征來(lái)描述信道模式噪聲,進(jìn)而獲得穩(wěn)定的信道噪聲分布.統(tǒng)計(jì)幀是語(yǔ)音信號(hào)中所有短時(shí)幀的相同頻率成分的平均值,設(shè)X={x1[n],x2[n],…,xT[n]}表示有T幀的語(yǔ)音信號(hào),則第i(1≤i≤T)幀信號(hào)xi[n](0≤n≤N-1)的離散傅里葉變換為

        那么統(tǒng)計(jì)幀的表達(dá)式為

        統(tǒng)計(jì)幀的具體提取過(guò)程如圖3所示.

        圖3 統(tǒng)計(jì)幀的提取過(guò)程Fig.3 Procedure of extracting statistical frames

        統(tǒng)計(jì)幀具有以下優(yōu)點(diǎn):1)統(tǒng)計(jì)幀是將大量短時(shí)語(yǔ)音幀在頻域進(jìn)行疊加,從而可獲得穩(wěn)定的信道模式噪聲分布;2)統(tǒng)計(jì)幀具有歸一化的作用,它可以將時(shí)域中不同長(zhǎng)度的語(yǔ)音信號(hào)映射為在頻域具有相同幀長(zhǎng)的信號(hào),以降低特征提取和建模的計(jì)算復(fù)雜度.

        因?yàn)閾Q能器和各種電路引入的信道噪聲為時(shí)域的卷積信號(hào)[7],所以考慮在對(duì)數(shù)譜域來(lái)提取信道模式噪聲,將非線性噪聲轉(zhuǎn)換為線性噪聲.如圖4所示,在基于統(tǒng)計(jì)幀的對(duì)數(shù)功率譜上,原始語(yǔ)音與回放語(yǔ)音(原始語(yǔ)音與回放語(yǔ)音都來(lái)自同一個(gè)說(shuō)話人,且文本為同一數(shù)字串“5940247874”)在低頻部分存在差異,這是由原始語(yǔ)音和回放語(yǔ)音所包含的信道模式噪聲不同引起的,表明信道模式噪聲主要集中在信號(hào)的低頻部分.與信道引入的卷積噪聲主要集中在信號(hào)的低頻部分[8]一致.

        圖4 基于統(tǒng)計(jì)幀的對(duì)數(shù)功率譜Fig.4 Logarithm power spectrum based on statistical frames

        1.2 信道模式噪聲及特征

        由于信道模式噪聲主要集中在信號(hào)的低頻部分,故文中采用去噪濾波器來(lái)提取信道模式噪聲,即

        式中:yo[n]、yp[n]、No和Np分別為原始語(yǔ)音、回放語(yǔ)音、原始語(yǔ)音的信道模式噪聲及回放語(yǔ)音的信道模式噪聲;DFT為離散傅里葉變換;f為去噪濾波器,文中采用高通濾波器來(lái)過(guò)濾掉信號(hào)中的信道模式噪聲.通過(guò)對(duì)多個(gè)去噪濾波器的實(shí)驗(yàn),最終采用文獻(xiàn)[9]中的濾波器.

        基于信道模式噪聲的長(zhǎng)時(shí)統(tǒng)計(jì)特征提取的流程如圖5所示,在信道模式噪聲的基礎(chǔ)上提取了兩組長(zhǎng)時(shí)特征:6階Legendre多項(xiàng)式系數(shù)和6個(gè)統(tǒng)計(jì)特征.

        圖5 基于信道模式噪聲的長(zhǎng)時(shí)統(tǒng)計(jì)特征提取流程圖Fig.5 Extraction flowchart of long-term features based on channel pattern noise

        1.2.1 Legendre多項(xiàng)式系數(shù)

        Legendre多項(xiàng)式是一組完備正交基,可以很好地進(jìn)行參數(shù)擬合,已在語(yǔ)種識(shí)別和一些實(shí)際問(wèn)題的解決中成功應(yīng)用[10].Legendre多項(xiàng)式的形式如下:

        信道模式噪聲變化緩慢,在實(shí)際應(yīng)用中Legendre多項(xiàng)式系數(shù)的階數(shù)不高,實(shí)際上使用6階的系數(shù)就能夠進(jìn)行信道模式噪聲的參數(shù)擬合.其中,L0為信道模式噪聲的直流部分,L1為信道模式噪聲分布曲線的斜率,L2為信道模式噪聲分布曲線的曲率,L3、L4、L5分別為信道模式噪聲分布曲線的細(xì)節(jié)信息.

        1.2.2 統(tǒng)計(jì)特征

        因信道模式噪聲一直伴隨著語(yǔ)音信號(hào)并且變化緩慢,故文中采用6種統(tǒng)計(jì)特征來(lái)描述信道模式噪聲:信道模式噪聲的最小值 PN_min、最大值 PN_max、均值 PN_mean、中值 PN_median,最大值和最小值的差PN_diff、標(biāo)準(zhǔn)差PN_stdev.

        1.3 基于SVM的信道噪聲模型

        SVM是一種基于結(jié)構(gòu)風(fēng)險(xiǎn)的統(tǒng)計(jì)學(xué)習(xí)方法,具有很好的泛化和分類能力,已在說(shuō)話人識(shí)別中取得了很好的效果[11].SVM可以看成由多個(gè)內(nèi)積K(xi,xj)求和構(gòu)成的二類分類器.錄音回放攻擊檢測(cè)實(shí)質(zhì)上是一個(gè)二分問(wèn)題.對(duì)于輸入矢量x,支持向量機(jī)的輸出為

        式中:α*為分類的最優(yōu)化解,α*=(,,…,);b*為分類閾值;yi為分類標(biāo)簽,yi∈{-1,1}.

        文中將兩組長(zhǎng)時(shí)特征組合成一個(gè)12維的特征矢量,并作為訓(xùn)練和識(shí)別的特征,選擇徑向基函數(shù)作為核函數(shù).然后采用自組織映射(SOM)算法[12]和格形搜索算法[13]找到最優(yōu)的懲罰因子C和γ參數(shù),并將最優(yōu)參數(shù)用來(lái)訓(xùn)練信道噪聲模型.

        2 APSD數(shù)據(jù)庫(kù)

        由于沒(méi)有現(xiàn)成的數(shù)據(jù)庫(kù),文中建立了原始語(yǔ)音和回放語(yǔ)音數(shù)據(jù)庫(kù)(APSD)進(jìn)行錄音回放攻擊檢測(cè)的研究.考慮到語(yǔ)速、文本類型、朗讀語(yǔ)音和自然語(yǔ)音等的影響,該數(shù)據(jù)庫(kù)的語(yǔ)料設(shè)計(jì)如下:1)20個(gè)孤立詞短語(yǔ);2)10個(gè)連續(xù)數(shù)字串,每個(gè)數(shù)字串包含10個(gè)數(shù)字;3)60個(gè)音素和音節(jié)分布均勻的句子(每句5~16個(gè)字),其中15句選自863連續(xù)語(yǔ)音庫(kù),15句選自863四大方言庫(kù),15句選自《人民日?qǐng)?bào)》,15句選自“新華網(wǎng)”;4)兩篇音素和音節(jié)分布均勻的短文,共223個(gè)字,以正常的語(yǔ)速朗讀;5)第三部分和第四部分的語(yǔ)料以慢速和快速朗讀各一遍;6)從5個(gè)話題中選取一個(gè)進(jìn)行即興演講,長(zhǎng)度約為2min.

        數(shù)據(jù)庫(kù)錄制歷時(shí)6個(gè)月,有9男4女參與錄制,用統(tǒng)一標(biāo)準(zhǔn)的普通話進(jìn)行錄音.經(jīng)統(tǒng)計(jì),本語(yǔ)料庫(kù)的字頻和《現(xiàn)代漢語(yǔ)頻率詞典》提供的漢字字頻基本保持一致,包含1473個(gè)中文漢字、345個(gè)音節(jié)、漢語(yǔ)中所有的60個(gè)音素.

        原始語(yǔ)音與回放語(yǔ)音的錄制模擬了實(shí)際錄音回放攻擊產(chǎn)生的整個(gè)物理過(guò)程.原始語(yǔ)音是通過(guò)固定的麥克風(fēng)和數(shù)據(jù)采集卡(創(chuàng)新5.1聲卡,設(shè)置為16kHz,16位)進(jìn)行采集.在采集原始語(yǔ)音的同時(shí),用高保真的數(shù)字錄音筆錄制說(shuō)話人語(yǔ)音,模仿偷錄過(guò)程(偷錄者會(huì)盡量采用高保真的錄音設(shè)備獲得高品質(zhì)的偷錄語(yǔ)音,文中采用高保真數(shù)字錄音筆三星yep120,采樣率為22.05kHz,并用16位采樣),然后通過(guò)便攜高保真直流功放(奧特藍(lán)星iMT237)在數(shù)據(jù)采集卡的輸入端回放錄音,從而采集回放語(yǔ)音.

        3 實(shí)驗(yàn)結(jié)果與討論

        從APSD數(shù)據(jù)庫(kù)中選取了12220個(gè)語(yǔ)音樣本,包含了13個(gè)說(shuō)話人的數(shù)據(jù),每個(gè)人的數(shù)據(jù)為940個(gè)(470個(gè)原始樣本Au_R和470個(gè)回放樣本Pb_R),實(shí)驗(yàn)數(shù)據(jù)的分布如表1所示.文中采用FRR(錯(cuò)誤拒絕率)和FAR(錯(cuò)誤接受率)作為評(píng)價(jià)錄音回放攻擊檢測(cè)系統(tǒng)性能的指標(biāo),同時(shí)采用十折交叉驗(yàn)證進(jìn)行實(shí)驗(yàn),結(jié)果為10次實(shí)驗(yàn)結(jié)果的平均值.統(tǒng)計(jì)幀的幀長(zhǎng)取512點(diǎn),Legendre多項(xiàng)式取0~5階系數(shù).

        表1 選取的實(shí)驗(yàn)樣本數(shù)Table 1 Numbers of selected data samples

        實(shí)驗(yàn)1 組織了10名志愿者(7男3女)參與聽(tīng)覺(jué)實(shí)驗(yàn),要求每個(gè)志愿者聽(tīng)100個(gè)語(yǔ)音樣本(50個(gè)原始語(yǔ)音樣本和50個(gè)回放語(yǔ)音樣本),然后做出選擇(志愿者事先不知道語(yǔ)音樣本的類別).總共進(jìn)行了1000次聽(tīng)覺(jué)實(shí)驗(yàn),正確識(shí)別率為58.6%,說(shuō)明人耳對(duì)原始語(yǔ)音和回放語(yǔ)音的分辨能力很低.

        采用Au_R和Pb_R數(shù)據(jù)集分別在基于混合高斯模型(GMM)和隱馬爾科夫模型(HMM)的說(shuō)話人辨識(shí)系統(tǒng)上進(jìn)行說(shuō)話人識(shí)別實(shí)驗(yàn).實(shí)驗(yàn)時(shí),GMM說(shuō)話人辨認(rèn)系統(tǒng)的高斯個(gè)數(shù)設(shè)為256,HMM說(shuō)話人辨認(rèn)系統(tǒng)的狀態(tài)個(gè)數(shù)設(shè)為4,每個(gè)狀態(tài)下的高斯個(gè)數(shù)設(shè)為64.原始語(yǔ)音和回放語(yǔ)音在GMM系統(tǒng)上的正確率分別為97.7318%和93.6966%,在HMM系統(tǒng)上的正確率分別為87.2781%和81.0897%,即回放語(yǔ)音的說(shuō)話人正確識(shí)別率和原始語(yǔ)音保持在同一個(gè)水平上,這說(shuō)明錄音回放語(yǔ)音對(duì)于說(shuō)話人識(shí)別系統(tǒng)的攻擊是真實(shí)存在的.

        實(shí)驗(yàn)2 利用13個(gè)人的數(shù)據(jù)建立前端錄音回放攻擊檢測(cè)器,采用文中方法和文獻(xiàn)[5]中方法在APSD數(shù)據(jù)庫(kù)上進(jìn)行實(shí)驗(yàn).實(shí)現(xiàn)文獻(xiàn)[5]中方法時(shí),采用雙門限法提取靜音,并用譜減法濾波,采用39維的Mel倒譜系數(shù)(MFCC),建立信道模型時(shí)GMM的高斯個(gè)數(shù)設(shè)為512.文中方法的FRR和FAR分別為2.861 9%和2.450 7%,與文獻(xiàn)[5]中方法的15.6732%、15.6732%相比,下降了近13%.

        將回放攻擊檢測(cè)模塊加載到GMM-UBM說(shuō)話人確認(rèn)系統(tǒng)(該系統(tǒng)的高斯個(gè)數(shù)為1024)的前端進(jìn)行對(duì)比實(shí)驗(yàn),同一用戶的回放語(yǔ)音歸為不是該用戶的語(yǔ)音,實(shí)驗(yàn)結(jié)果如圖6所示.對(duì)于含有回放攻擊語(yǔ)音的數(shù)據(jù),未加載回放攻擊檢測(cè)模塊時(shí),說(shuō)話人確認(rèn)系統(tǒng)的錯(cuò)誤率很高,系統(tǒng)的等錯(cuò)誤率(EER,即FAR=FRR時(shí))為40.1709%,此時(shí),系統(tǒng)的安全性能很低;加載文中回放攻擊檢測(cè)模塊后,系統(tǒng)的 EER為10.2564%,下降了約30%;加載文獻(xiàn)[5]中的回放攻擊檢測(cè)模塊后,系統(tǒng)的EER為29.0598%,下降了約11%,表明文中方法的檢測(cè)效果優(yōu)于文獻(xiàn)[5]中方法.

        圖6 加載錄音回放攻擊檢測(cè)模塊前后說(shuō)話人確認(rèn)系統(tǒng)的錯(cuò)誤率對(duì)比Fig.6 Comparison of error rates between speaker verification systems with and without playback detector

        為每個(gè)說(shuō)話人建立后端錄音回放攻擊檢測(cè)器,其中F01-F04為4位女性說(shuō)話人,M01-M09為9位男性說(shuō)話人,F(xiàn)03、M03及M04的FRR和FAR都為0,結(jié)果如表2所示.由圖6、表2可知,后端回放檢測(cè)的效果比前端檢測(cè)好.

        表2 后端錄音回放攻擊檢測(cè)器的檢測(cè)結(jié)果Table 2 Detection results of back-end playba ck attack detector

        實(shí)驗(yàn)3 以錄音回放攻擊檢測(cè)系統(tǒng)為基礎(chǔ),將傳統(tǒng)的倒譜特征和文中的長(zhǎng)時(shí)統(tǒng)計(jì)特征進(jìn)行對(duì)比實(shí)驗(yàn),結(jié)果如表3所示.從表3中可知,由6階Legendre系數(shù)和6個(gè)統(tǒng)計(jì)特征組成的基于統(tǒng)計(jì)幀的12維長(zhǎng)時(shí)特征比其它特征有更好的識(shí)別性能.信道模式噪聲主要集中在語(yǔ)音信號(hào)的低頻部分,MFCC和線性預(yù)測(cè)倒譜系數(shù)(LPCC)等倒譜特征中低頻部分所占比重很小,不能很好地體現(xiàn)信道信息,而文中采用的長(zhǎng)時(shí)特征是基于信道模式噪聲提取的,可凸顯出信道信息,因此具有更好的識(shí)別性能.

        表3 基于不同特征的回放攻擊檢測(cè)結(jié)果Table 3 Playback attack detection results based on different features

        與基于短時(shí)幀的12維長(zhǎng)時(shí)特征相比,基于統(tǒng)計(jì)幀的12維長(zhǎng)時(shí)特征有更好的檢測(cè)效果和識(shí)別性能.這說(shuō)明基于統(tǒng)計(jì)幀的分析方法對(duì)于回放攻擊檢測(cè)是有效的.

        實(shí)驗(yàn)4 考察不同語(yǔ)速、不同文本類型、不同說(shuō)話人等因素對(duì)錄音回放攻擊檢測(cè)系統(tǒng)的影響,結(jié)果如表4、5所示.表4表明,語(yǔ)速對(duì)錄音回放攻擊檢測(cè)系統(tǒng)有一定的影響,但影響不明顯.

        表5表明,不同類型文本對(duì)錄音回放攻擊檢測(cè)性能有較大的影響,段落文本的FRR和FAR最低,主要是因?yàn)槎温涞臅r(shí)長(zhǎng)最長(zhǎng),為3min左右(數(shù)字串和句子的長(zhǎng)度為5~8s,而短語(yǔ)的長(zhǎng)度為2~3s),可以提供更多的信道噪聲信息,獲得更穩(wěn)定的信道噪聲分布.在實(shí)際應(yīng)用中,可以考慮采用數(shù)字串作為用戶進(jìn)入系統(tǒng)的口令(數(shù)字串的FAR低,可保證系統(tǒng)的安全性).

        表4 語(yǔ)速對(duì)回放攻擊檢測(cè)性能的影響Table 4 Influence of speech rate on playback attack detection performance

        表5 文本類型對(duì)回放攻擊檢測(cè)性能的影響Table 5 Influence of text type on playback attack detection performance

        從表2可知,錄音回放攻擊檢測(cè)系統(tǒng)對(duì)不同說(shuō)話人的回放攻擊檢測(cè)性能也是不一樣的,不同說(shuō)話人對(duì)文中錄音回放攻擊檢測(cè)系統(tǒng)的性能也會(huì)產(chǎn)生影響.

        4 結(jié)語(yǔ)

        文中通過(guò)提取信道模式噪聲來(lái)檢測(cè)說(shuō)話人識(shí)別系統(tǒng)中的錄音回放攻擊,實(shí)驗(yàn)表明,回放攻擊檢測(cè)的FFR和 FAR分別為 2.861 9%、2.450 7%,與文獻(xiàn)[5]中方法相比,均下降了近13%.加載了文中的錄音回放攻擊檢測(cè)系統(tǒng)后,說(shuō)話人確認(rèn)系統(tǒng)的EER下降了約30%.

        目前,文中只使用了一種錄音和回放設(shè)備,獲得了一些初步結(jié)果,還需要擴(kuò)展其它類型的錄音和回放設(shè)備,以及包含更多說(shuō)話人的數(shù)據(jù)來(lái)驗(yàn)證文中方法的魯棒性;另外,還將對(duì)信道模式噪聲的性質(zhì)做進(jìn)一步的研究,并利用信道模式噪聲來(lái)解決語(yǔ)音識(shí)別和說(shuō)話人識(shí)別中的信道不匹配問(wèn)題.

        [1]Vale E E,Alcaim A.Adaptive weighting of subband classifier responses for robust text independent speaker recognition [J].Electronics Letters,2008,44(21):1280-1282.

        [2]Wah Lau Yee,Wagner M,Tran D.Vulnerability of speaker verification to voice mimicking[C]∥Proceedings of Intelligent Multimedia,Video & Speech Processing.Hong Kong:IEEE,2004:145-148.

        [3]Shang Wei,Stevenson M.Score normalization in playback attack detection[C]∥Proceedings of Acoustics,Speech and Signal Processing.Dallas:IEEE,2010:1678-1681.

        [4]Campbell J P,Shen W,Campbell W M,et al.Forensic speaker recognition [J].IEEE Signal Processing Magazine,2009,26(2):95-103.

        [5]張利鵬,曹犟,徐明星,等.防止假冒者闖入說(shuō)話人識(shí)別系統(tǒng)[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2008,48(增刊):699-703.Zhang Li-peng,Cao Jiang,Xu Ming-xing,et al.Prevention of impostors entering speaker recognition systems[J].Journal of Tsinghua University:Science and Technology,2008,48(S1):699-703.

        [6]Pohlmann K C.Principles of digital audio[M].6th ed.New York:McGraw-Hill,2010.

        [7]趙力.語(yǔ)音信號(hào)處理[M].2版.北京:機(jī)械工業(yè)出版社,2009.

        [8]Hermansky H,Morgan N.RASTA processing of speech[J].IEEE Transactions on Speech and Audio Processing,1994,2(4):578-589.

        [9]Hanson B A,Applebaum T H.Subband or cepstral domain filtering for recognition of Lombard and channel-distorted speech[C]∥Proceedings of Acoustics,Speech and Signal Processing.Minneapolis:IEEE,1993:79-82.

        [10]Lin Chi-Yueh,Wang Hsiao-Chuan.Language identification using pitch contour information[C]∥Proceedings of Acoustics,Speech and Signal Processing.Philadelphia:IEEE,2005:601-604.

        [11]You Chang Huai,Lee Kong Aik,Li Haizhou.GMM-SVM kernel with a Bhattacharyya based distance for speaker recognition [J].IEEE Transactions on Audio,Speech,and Language Processing,2010,18(6):1300-1312.

        [12]Tas?demir K,Milenov P,Tapsall B.Topology based hierarchical clustering of self-organizing maps[J].IEEE Transactions on Neural Networks,2011,22(3):474-485.

        [13]Hesterman J Y,Caucci L,Kupinski M A,et al.Maximum-likelihood estimation with a contracting grid search algorithm[J].IEEE Transactions on Nuclear Science,2010,57(3):1077-1084.

        猜你喜歡
        錄音信道語(yǔ)音
        Listen and Paint, etc.
        Funny Phonics
        魔力語(yǔ)音
        基于MATLAB的語(yǔ)音信號(hào)處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對(duì)方正在輸入……
        Colorful Seasons多彩四季
        A New Term
        基于導(dǎo)頻的OFDM信道估計(jì)技術(shù)
        一種改進(jìn)的基于DFT-MMSE的信道估計(jì)方法
        国产高清自产拍av在线| 变态另类人妖一区二区三区 | 丰满五十六十老熟女hd| 国产精品半夜| 国产亚洲美女精品久久久2020| 中文字幕一区二区三区日日骚| 精品福利一区二区三区免费视频 | 日韩av水蜜桃一区二区三区| 日韩人妻中文字幕高清在线| 无码精品人妻一区二区三区av| 推油少妇久久99久久99久久 | 五月天激情电影| 久久9精品区-无套内射无码| 国产精品老熟女露脸视频 | 国产一区二区av在线观看| 精品激情成人影院在线播放| 人妻仑乱a级毛片免费看| 亚洲av无码成人黄网站在线观看| 色婷婷色99国产综合精品| 日本一区二区三区一级免费| 久久一二区女厕偷拍图| 麻豆国产在线精品国偷产拍| 日韩在线不卡免费视频| 国产精品国产自线拍免费| 亚洲国产av一区二区不卡| 一区二区三区精品少妇| 国产伦人人人人人人性| 又爽又黄无遮挡高潮视频网站| 国产精品亚洲美女av网站| 91精品国产福利在线观看麻豆 | 人妻激情偷乱一区二区三区| 久精品国产欧美亚洲色aⅴ大片 | av在线免费观看大全| 国产激情一区二区三区| 免费看黄色电影| 国产av日韩a∨亚洲av电影| 午夜视频免费观看一区二区| 久久一区二区三区久久久| 久久久精品人妻无码专区不卡| 亚洲av无码一区二区乱子伦as | 亚洲欧美一区二区三区|