申小虎金 恬張長(zhǎng)珍萬(wàn)榮春
(1 江蘇警官學(xué)院 江蘇 南京 210031;2 江蘇省公安廳物證鑒定中心 江蘇 南京 210031)
咳嗽音特征在話(huà)者識(shí)別中參考價(jià)值的相關(guān)研究
申小虎1金 恬2張長(zhǎng)珍1萬(wàn)榮春1
(1 江蘇警官學(xué)院 江蘇 南京 210031;2 江蘇省公安廳物證鑒定中心 江蘇 南京 210031)
為確定聲紋鑒定中咳嗽音聲紋特征的應(yīng)用價(jià)值,錄制30名條件相近、身體健康發(fā)音人的咳嗽聲各3組樣本。將樣本輸入OTExpert法庭語(yǔ)音分析工作站,并對(duì)各樣本的寬帶語(yǔ)譜、LPC頻譜、MFCC倒譜、信號(hào)能量譜圖進(jìn)行分析比較。相同個(gè)體樣本的咳嗽音與不同個(gè)體的咳嗽音相比較,在共振峰頻率與過(guò)渡形態(tài)、基頻參數(shù)、音強(qiáng)曲線(xiàn)的差異性,前者明顯小于后者,但相比普通語(yǔ)音個(gè)體穩(wěn)定性較弱。單一咳嗽音特征在話(huà)者識(shí)別中具有參考價(jià)值,但不能作為同一認(rèn)定的標(biāo)準(zhǔn)。
咳嗽音 共振峰 基頻 音強(qiáng) 話(huà)者識(shí)別
日常生活中我們經(jīng)常遇到僅從咳嗽音就能判斷發(fā)音個(gè)體的情形。在實(shí)際案例中也存在利用背景噪聲中潛在的咳嗽音、清喉音、清鼻音等不帶有文字信息的聲紋片段縮小偵查范圍,指明工作方向從而快速偵破案件。針對(duì)上述情況,從理論角度上判斷咳嗽音特征是話(huà)者識(shí)別中是否具有參考價(jià)值,開(kāi)展此項(xiàng)研究。
咳嗽音是一種聲道的應(yīng)激性反應(yīng),發(fā)音原理同普通語(yǔ)音聲紋信息相同,都是聲門(mén)氣流激勵(lì)聲道,最后通過(guò)口腔輻射。典型咳嗽語(yǔ)音信號(hào)從產(chǎn)生到結(jié)束持續(xù)時(shí)間一般不超過(guò)1秒,其過(guò)程大致可分為聲門(mén)打開(kāi)階段與聲門(mén)關(guān)閉階段。
聲門(mén)打開(kāi)階段期間,聲帶由迅速通過(guò)的氣流快速打開(kāi),聲門(mén)下的高壓空氣快速排出時(shí)帶動(dòng)聲帶振動(dòng),并進(jìn)入平穩(wěn)階段,此階段為稱(chēng)為咳嗽音的爆發(fā)期,能量最高。如圖1(A)(B)中的區(qū)域Ⅰ所示。聲門(mén)關(guān)閉階段期間,由于收尾氣流在聲帶回位時(shí)引起聲帶周期性振動(dòng),并隨著氣流的減緩聲門(mén)最終關(guān)閉,波形能量逐漸減弱。如圖1(A)(B)中的區(qū)域Ⅱ所示。由于咳嗽發(fā)音方式不同,有的咳嗽音由于收尾氣流在聲帶回位時(shí)聲帶的周期性振動(dòng)產(chǎn)生波形的突起部分,這部分也可屬于聲門(mén)關(guān)閉階段,稱(chēng)為咳嗽音的第二聲[1]。如圖1(A)的區(qū)域Ⅲ所示。
圖1 咳嗽音時(shí)域波形圖的兩種形態(tài)
2.1 實(shí)驗(yàn)設(shè)備
實(shí)驗(yàn)硬件設(shè)備為研華科技610H工控機(jī),CPUi7-4790 3.60G雙核,內(nèi)存16GB。采用Gnome-p錄音設(shè)備進(jìn)行咳嗽音錄音采集,利用Adobe Audition CS5.5軟件對(duì)其進(jìn)行剪輯,消除空白音域,并歸檔建庫(kù)。最后使用俄羅斯法庭語(yǔ)音分析系統(tǒng)OT-Expert 5.1對(duì)采集語(yǔ)音的共振峰特性、基頻參數(shù)、信號(hào)能量等指標(biāo)進(jìn)行測(cè)量對(duì)比。
2.2 樣本取樣
選擇30名20~22歲處于健康狀態(tài)下(非感冒期間) 的男性個(gè)體20名,女性個(gè)體10名,利用Gnome-P錄音設(shè)備在聲紋錄音室,根據(jù)司法部錄音資料鑒定規(guī)范[2]進(jìn)行咳嗽音錄音,每名個(gè)體不間斷連續(xù)咳嗽3次。
2.3 實(shí)驗(yàn)組織方法
對(duì)上述咳嗽音信號(hào)的共振峰的頻率、咳嗽音的共振峰過(guò)渡形態(tài)、基頻參數(shù)、短時(shí)能量等特性進(jìn)行提取計(jì)算,選取幾種特征顯著的樣本,分別討論相同個(gè)體咳嗽音間的穩(wěn)定性與不同個(gè)體咳嗽音間的差異性。
從對(duì)30組個(gè)體咳嗽音的實(shí)驗(yàn)對(duì)比中我們發(fā)現(xiàn),不同個(gè)體的咳嗽音在共振峰頻率與過(guò)渡形態(tài)、基頻參數(shù)、短時(shí)能量上不盡相同,有時(shí)會(huì)出現(xiàn)明顯的差異;而相同個(gè)體在上述參數(shù)的差異性則不明顯。
3.1 個(gè)體咳嗽音間共振峰的頻率
根據(jù)咳嗽信號(hào)產(chǎn)生的生理機(jī)理,對(duì)相同個(gè)體的咳嗽音和不同個(gè)體的咳嗽音,在聲帶打開(kāi)階段和關(guān)閉階段分別統(tǒng)計(jì)其共振峰頻率。由于咳嗽音共振峰曲線(xiàn)條紋沒(méi)有普通元音共振峰曲線(xiàn)條紋明顯,為了區(qū)別共振峰頻率差異,我們使用LPC頻譜得到共振峰曲線(xiàn)。因篇幅有限,這里僅列出不同個(gè)體間咳嗽音(聲門(mén)打開(kāi)階段)的基頻曲線(xiàn)圖,如圖2所示。其中咳嗽音1為女性,2、3均為男性。從圖2我們可以看出,由于咳嗽音1為女個(gè)體發(fā)音,與元音發(fā)音的規(guī)律類(lèi)似,各共振峰頻率略高于男個(gè)體咳嗽音2、3。
圖2 不同個(gè)體咳嗽音(聲門(mén)打開(kāi)階段)LPC頻譜的共振峰曲線(xiàn)
為了更好地說(shuō)明同一個(gè)體咳嗽音的穩(wěn)定性與不同個(gè)體間的差異性,我們對(duì)男個(gè)體2、3咳嗽音與個(gè)體3的兩次咳嗽音的定量化統(tǒng)計(jì)分析結(jié)果進(jìn)行整理,如表1、表2所示??梢?jiàn)不同個(gè)體間咳嗽音的F2、F3、F4在聲門(mén)打開(kāi)階段和聲門(mén)關(guān)閉階段的頻率相對(duì)偏差大于相同個(gè)體下得到的相對(duì)偏差。這里由于篇幅的原因,沒(méi)有將30組相同個(gè)體咳嗽音的共振峰相對(duì)偏差列出,但需要指出的是相同個(gè)體的不同咳嗽音間存在共振峰相對(duì)偏差較大的情況。
表1 不同男性個(gè)體咳嗽音間共振峰統(tǒng)計(jì)
表2 相同男性個(gè)體咳嗽音間共振峰統(tǒng)計(jì)
3.2 個(gè)體咳嗽音的共振峰的過(guò)渡形態(tài)
共振峰的音節(jié)間過(guò)渡形態(tài)具有人際差異性,因而聲紋鑒定中具有一定的利用價(jià)值[3]。由于咳嗽音信號(hào)受到咳嗽爆發(fā)湍流的影響,聲紋共振峰曲線(xiàn)與基頻條紋沒(méi)有普通語(yǔ)音信號(hào)那么明顯,我們從錄取的數(shù)據(jù)庫(kù)中選取湍流影響不明顯的咳嗽音作為本次實(shí)驗(yàn)的樣本,進(jìn)而研究這些頻域特征保持完好咳嗽音的各項(xiàng)性能指標(biāo)對(duì)同一性認(rèn)定的價(jià)值。
圖3中(A)、(B)、(C)為同一人發(fā)出的3次咳嗽聲,可以看出從聲門(mén)打開(kāi)到穩(wěn)定階段再到最后的聲門(mén)關(guān)閉,F(xiàn)1共振峰均有先升后降的趨勢(shì),而且3個(gè)階段共振峰過(guò)渡形態(tài)平滑自然。而圖4中(B)、(C)共振峰則沒(méi)有(A)先升后降的趨勢(shì),同時(shí)(C)出現(xiàn)了間斷過(guò)渡。間斷過(guò)渡產(chǎn)生的原因是在咳嗽發(fā)聲過(guò)程的交界處,舌位發(fā)生了突變,從而造成共振峰曲線(xiàn)的間斷。
3.3 個(gè)體咳嗽音間的基頻參數(shù)
利用MFCC倒譜對(duì)30組咳嗽聲音的基頻參數(shù)進(jìn)行統(tǒng)計(jì)。限于篇幅原因,僅列出兩組不同個(gè)體與相同個(gè)體的咳嗽音間的基頻參數(shù)對(duì)比表,如表3、表4所示。同共振峰頻率類(lèi)似,不同個(gè)體的基頻相對(duì)偏差要比相同個(gè)體下差異較大。
基頻反映聲帶振動(dòng)速度,基頻最小值與基頻最大值分別是從倒譜上提取的數(shù)值中的最小及最大數(shù)值。通過(guò)對(duì)30組基頻最小值的統(tǒng)計(jì)對(duì)比發(fā)現(xiàn),基頻最小值的相對(duì)偏差在不同個(gè)體與相同個(gè)體間的差異率區(qū)別明顯并相對(duì)穩(wěn)定。這是由于基頻受音調(diào)的影響,最大值會(huì)出現(xiàn)高低變化,而基頻最小值不易于偽裝具備穩(wěn)定性。因此基頻最小值是基頻參數(shù)中最有價(jià)值的參考數(shù)據(jù)。同時(shí)實(shí)驗(yàn)數(shù)據(jù)中咳嗽音的基頻頻率要比普通元音發(fā)音的基頻頻率高,這是由于咳嗽音的發(fā)音方式近似緊喉嗓音(Creaky Voice),聲帶在這種發(fā)音方式下是處于緊繃狀態(tài),只有很小一部分在振動(dòng),因此基頻要比普通元音發(fā)音的語(yǔ)音更高。
圖3 相同個(gè)體的咳嗽音共振峰寬帶語(yǔ)譜
圖4 不同個(gè)體的咳嗽音共振峰寬帶語(yǔ)譜
表3 不同個(gè)體(男)咳嗽音間的基頻參數(shù)對(duì)比
表4 相同個(gè)體(女)咳嗽音間的基頻參數(shù)對(duì)比
3.4 個(gè)體咳嗽音間的即時(shí)能量(音強(qiáng))
音強(qiáng)是語(yǔ)音的4要素之一,也是聲紋鑒定中重要特征之一[4]??人砸舻囊魪?qiáng)分布比較復(fù)雜,本實(shí)驗(yàn)僅針對(duì)咳嗽期間的即時(shí)能量按時(shí)間方向的動(dòng)態(tài)分布情況進(jìn)行了比較分析。圖5中的(A)、(B)、(C)是相同個(gè)體咳嗽3次所生成的音強(qiáng)曲線(xiàn)圖??梢钥闯觯瑥淖邉?shì)上大致相同且均呈現(xiàn)兩端強(qiáng)中間弱的情況。這是由于聲門(mén)打開(kāi)階段與聲門(mén)關(guān)閉階段所帶動(dòng)的振動(dòng)幅度大于穩(wěn)定期間的振動(dòng)幅度所造成的。
圖5 相同個(gè)體的咳嗽音即時(shí)能量(音強(qiáng))曲線(xiàn)
圖6 不同個(gè)體的咳嗽音即時(shí)能量(音強(qiáng))曲線(xiàn)
圖6中(A)、(B)、(C)分別是不同個(gè)體咳嗽聲生成的音強(qiáng)曲線(xiàn)。從走勢(shì)上,(B)一直處于下降趨勢(shì)。(C)雖然也明顯具有兩端強(qiáng)中間弱的特征,但聲門(mén)打開(kāi)階段保持時(shí)間明顯小于聲門(mén)關(guān)閉時(shí)間。
咳嗽音的共振峰頻率的發(fā)音機(jī)理與普通語(yǔ)音音節(jié)發(fā)音機(jī)理相同,都是通過(guò)發(fā)音器官的振動(dòng)發(fā)出聲音,具有相同的數(shù)據(jù)模型,因此大部分音節(jié)前4階(F1-F4)共振峰頻率變異系數(shù)范圍不會(huì)超過(guò)12%[5]。表1、表2中的實(shí)驗(yàn)數(shù)據(jù)基本滿(mǎn)足相同個(gè)體與不同個(gè)體間咳嗽音識(shí)別所滿(mǎn)足的閾值。但30組相同個(gè)體中也存在相對(duì)偏差較大,與普通語(yǔ)音樣本比較存在個(gè)體穩(wěn)定性不高的情況。共振峰走勢(shì)的差異形成,一方面是由于不同個(gè)體由于聲帶和聲道等發(fā)音器官的不同,另一方面是由于咳嗽習(xí)慣帶來(lái)的發(fā)音器官運(yùn)動(dòng)過(guò)程所造成的。后者可以通過(guò)訓(xùn)練改變發(fā)音器官運(yùn)動(dòng)幅度從而達(dá)到偽造的目的。
本次實(shí)驗(yàn)結(jié)果表明基頻平均數(shù)值男女差距并不大。因?yàn)樵谠舻陌l(fā)聲過(guò)程中,男性個(gè)體的聲帶一般較女性個(gè)體的聲帶更加粗寬,因此男性語(yǔ)音的基頻一般較低。根據(jù)咳嗽音的生成機(jī)理,有時(shí)咳嗽的發(fā)聲沒(méi)有經(jīng)過(guò)聲門(mén)上系統(tǒng)的聲帶發(fā)音環(huán)節(jié),僅僅是根據(jù)咳嗽的發(fā)音習(xí)慣引起的聲門(mén)上系統(tǒng)口腔、鼻腔、唇腔等的變化帶來(lái)的咳嗽音基頻的不同,因此不能僅僅通過(guò)基頻判斷咳嗽音發(fā)聲個(gè)體的性別。
音強(qiáng)曲線(xiàn)分布的不同可能是咳嗽應(yīng)激反應(yīng)初始時(shí),肺部呼出氣體量而造成的。由于個(gè)體咳嗽習(xí)慣不同,肺活量大小不同,聲門(mén)打開(kāi)階段與聲門(mén)關(guān)閉時(shí)間因而也存在一定的差異。
以上結(jié)果表明,相同個(gè)體的咳嗽音在共振峰頻率與過(guò)渡形態(tài)、基頻參數(shù)、即時(shí)能量上有著與其他個(gè)體相比較存在一定的人際差異性。針對(duì)聲紋特征良好的咳嗽音,可以成為話(huà)者識(shí)別的輔助個(gè)體特征,在縮小偵查范圍上也具有一定的利用價(jià)值。但由于咳嗽音相比較普通語(yǔ)音,語(yǔ)音樣本片段較短、個(gè)體間的穩(wěn)定性相對(duì)較弱,所以不能僅從咳嗽音進(jìn)行同一認(rèn)定。除咳嗽音外,錄音片段中時(shí)常出現(xiàn)的清嗓音、清喉音等非言語(yǔ)信息是否也具有同咳嗽音一樣的認(rèn)定價(jià)值,這是下一步研究的內(nèi)容之一。在社會(huì)應(yīng)用方面,可以拓展到針對(duì)語(yǔ)音障礙的殘障人士身份識(shí)別研究方向。
[1]趙青.咳嗽音特征提取及在身份識(shí)別中的應(yīng)用研究[D].南京:南京郵電大學(xué),2009:8-15.
[2]中華人民共和國(guó)司法部司法鑒定管理局.司法部錄音資料鑒定規(guī)范:SF/Z JD0301001-2010[S/OL].北京:司法部司法鑒定技術(shù)研究所,2010:2[2010-04-07]. http://www.moj.gov.cn/tongyong/download/moj/11lyz ijd.pdf.
[3]王英利.聲紋鑒定中普通話(huà)音素間過(guò)渡方式特征研究[J].證據(jù)科學(xué),2011(1):100-105.
[4]王英利,潘自勤,常藍(lán)山.聲紋鑒定中的音強(qiáng)特征研究[J].中國(guó)司法鑒定,2011(5):19-22.
[5]申小虎,金恬,等.濾波降噪對(duì)語(yǔ)音同一認(rèn)定的影響[J].警察技術(shù),2015(6):32-35.
(責(zé)任編輯:孟凡騫)
D918.4
A
2095-7939(2016)04-0065-04
10.14060/j.issn.2095-7939.2016.04.014
2015-12-20
江蘇高校優(yōu)勢(shì)學(xué)科建設(shè)工程資助項(xiàng)目(PAP);江蘇警官學(xué)院科研項(xiàng)目(編號(hào):2016SJYZQ01);江蘇省教育廳資助項(xiàng)目(編號(hào):2014SJB246)。
申小虎(1981-),男,山東青州人,江蘇警官學(xué)院刑事科學(xué)技術(shù)系工程師,主要從事語(yǔ)音信號(hào)處理與視聽(tīng)資料檢驗(yàn)研究。