姜忠姣,王蘊(yùn)麗,陳德佳
隨著互聯(lián)網(wǎng)技術(shù)及數(shù)字音頻技術(shù)的飛速發(fā)展,越來越多的數(shù)字音頻文件在傳播過程中承載著關(guān)鍵信息,在司法取證、新聞報(bào)道、科學(xué)發(fā)現(xiàn)等領(lǐng)域中扮演著重要的角色,但頻繁出現(xiàn)的各種數(shù)字音頻篡改偽造的事件以及各種數(shù)字音頻編輯軟件的普及和廣泛使用,使人們對數(shù)字音頻的真實(shí)性和完整性提出了質(zhì)疑。針對不存在任何預(yù)先嵌入信息的數(shù)字音頻文件的惡意篡改,研究出切實(shí)可行的數(shù)字音頻篡改被動(dòng)檢測方法已經(jīng)是當(dāng)務(wù)之急,對維護(hù)社會(huì)秩序,打擊違法犯罪,保證司法公正以及新聞?wù)\信等具有重大的現(xiàn)實(shí)意義。
本文的研究對象為數(shù)字音頻文件,其是以數(shù)字化形式存在于硬盤、移動(dòng)介質(zhì)等載體設(shè)施上用以記錄音頻信息的文件。本文針對數(shù)字文件及語音信號原理,介紹了基于文件屬性檢驗(yàn)方法、聽覺檢驗(yàn)和聲譜分析方法、波形分析、頻譜分析、直流偏移、本底噪音分析、實(shí)驗(yàn)分析等數(shù)字音頻文件篡改檢驗(yàn)的系統(tǒng)方法,以期提高數(shù)字音頻文件篡改被動(dòng)檢驗(yàn)的有效性和準(zhǔn)確性,同時(shí)也展望了數(shù)字音頻文件篡改分析檢驗(yàn)的未來發(fā)展方向。
文件屬性檢驗(yàn)主要包括:
1)檢材錄音的文件名、格式、大小、時(shí)長、采樣率、聲道數(shù)、創(chuàng)建時(shí)間、修改時(shí)間、哈希值等文件屬性信息,截圖保存。
2)檢材文件的屬性與聲稱的錄制情況是否存在矛盾。
3)檢材與錄制設(shè)備中其他音/視頻的文件屬性的一致性。
圖1 插入不同采樣位數(shù)文件片段的檢驗(yàn)圖
每款錄音設(shè)備均有其固定的錄制參數(shù),其錄制形成的數(shù)字音頻文件一定符合該設(shè)備的相關(guān)錄制參數(shù)。音頻文件屬性檢驗(yàn)是通過提供的錄音器材錄制語音樣本獲取錄音設(shè)備參數(shù),再通過查看音頻文件屬性信息獲取音頻語言文件參數(shù),將兩項(xiàng)參數(shù)進(jìn)行分析比對,以二者參數(shù)的一致性來證明音頻文件是否經(jīng)過改動(dòng)。音頻文件屬性檢驗(yàn)方法一般作為音頻文件篡改分析檢驗(yàn)的初始步驟。例如,某檢材為16 位的音頻采樣位數(shù),通過波形圖檢驗(yàn),發(fā)現(xiàn)這個(gè)16 位音頻文件中的一小段語音表現(xiàn)出8 位的語音量化特征,分析這一小段8 位量化的語音是經(jīng)過后期編輯插入篡改形成的,不是原始錄音器材錄制形成(如圖1)。
實(shí)際檢驗(yàn)過程中,一般是聽覺檢驗(yàn)和聲譜分析相結(jié)合進(jìn)行的,通過聽語音、看聲譜圖,對檢材語音文件進(jìn)行全面檢驗(yàn)分析。依據(jù)“GA/T 1430-2017《法庭科學(xué)錄音的真實(shí)性檢驗(yàn) 技術(shù)規(guī)范》”,聽覺檢驗(yàn)、波形分析和頻譜分析的主要內(nèi)容為:
1)錄音的起始和結(jié)束信號情況。
2)檢材的總體情況,如錄制方式、信道、錄音內(nèi)容、說話人、環(huán)境等。
3)噪聲、背景聲的來源及變化情況,噪聲、背景聲的連續(xù)性和一致性,以及與語音的混疊情況。
4)錄音中出現(xiàn)的信號異常和信號丟失情況。
5)語音的連續(xù)性、同一性,語音的自然度,語義的關(guān)聯(lián)性和邏輯性。
6)頻譜范圍是否一致。
7)是否有音節(jié)丟失、缺損現(xiàn)象。
8)是否有異??瞻锥巍?/p>
9)是否有片段復(fù)制現(xiàn)象。
10)是否有噪聲、場景聲不一致和/或不連續(xù)現(xiàn)象。
11)是否有信號激變現(xiàn)象。
12)是否有其他異?,F(xiàn)象。
聽覺檢驗(yàn)時(shí)要反復(fù)認(rèn)真聽辨全部檢材語音,對語音的連續(xù)性、同一性,語音的自然度,語義的關(guān)聯(lián)性和邏輯性以及錄音中斷,背景噪音突變等可疑現(xiàn)象要進(jìn)行記錄。聲譜分析需注意檢材語音的背景噪聲是否一致,對話語聲、背景聲是否連續(xù)有無異常,檢材錄音中是否存在頻譜范圍不一致、異??瞻锥?、片段復(fù)制、信號覆蓋、脈沖信號、信號激變等異?,F(xiàn)象,對存疑部位要進(jìn)行記錄并分析其形成原因。檢驗(yàn)之前要向送檢人詳細(xì)了解錄音設(shè)備情況和語音的錄制過程,發(fā)現(xiàn)音頻文件與陳述的形成過程之間的矛盾,同時(shí)也可對聲控、關(guān)機(jī)、暫?;蛘`操作等形成的異常情況進(jìn)行解釋鑒別。
1.3.1 采樣直方圖檢驗(yàn)
采樣分布直方圖可以直觀的表示音頻文件采樣點(diǎn)的總體分布情況,可通過采樣直方圖的檢驗(yàn),發(fā)現(xiàn)音頻文件中插入的不同采樣方式錄制的語音片斷。圖2 為一篡改語音文件的采樣直方圖,在圖中出現(xiàn)3 種不同疏密采樣分布情況,選取2 個(gè)可疑片斷,其采樣直方圖的所示的采樣方式與整個(gè)文件都不同。
1.3.2 DC 偏移檢驗(yàn)
直流偏移指錄音設(shè)備在模擬信號轉(zhuǎn)換數(shù)字信號過程中存在直流分量,將信號偏離中軸線,在音頻文件檢驗(yàn)中可利用直流偏移的現(xiàn)象來檢測文件是否異常,例如錄音器材的直流校正,或不同錄音設(shè)備的電路板的直流偏移量不同。雖然人耳聽辯不出二者的明顯的區(qū)別,但通過對直流分量中心位置的檢驗(yàn),可以發(fā)現(xiàn)插入的語音片段。通常,當(dāng)不同設(shè)備錄制的音頻組合在一起時(shí)會(huì)發(fā)生這種情況。
1.3.3 重復(fù)采樣搜索
一些數(shù)字錄音機(jī)在錄制暫停到恢復(fù)期間,由于設(shè)備存在響應(yīng)時(shí)間,會(huì)在恢復(fù)時(shí)生成若干個(gè)采樣數(shù)值持續(xù)為零的采樣點(diǎn)。同時(shí)也針對有意將選取的片段設(shè)置為靜音的情況。
圖2 不同疏密采樣分布情況
頻譜檢驗(yàn)是針對音頻文件中插入不同頻譜成分語音片段進(jìn)行的分析檢驗(yàn)。頻譜反映了隨機(jī)信號各頻率成分功率能量分布情況,因此可以揭示信號中隱含的周期性及頻譜峰值等信息。未經(jīng)篡改的音頻文件中,各語音片段頻譜圖與整個(gè)語音頻譜圖均符合該錄音器材頻率響應(yīng)特性。不同信道其頻率響應(yīng)范圍存在差異,可以通過兩部分語音片斷的對比發(fā)現(xiàn)音頻文件是否經(jīng)過篡改。圖3 中綠色譜線為電話錄音,該電話信號經(jīng)過200Hz~3 400Hz 的帶通濾波器,紅色譜線的語音片段為手機(jī)直接錄音,可以發(fā)現(xiàn)二者錄音信道功率譜有明顯區(qū)別,因此可確定這兩個(gè)語音片斷不是同一錄音方式所錄制。
圖3 錄音筆與電話錄音的頻譜圖差異
一定條件下,錄制音頻的環(huán)境噪聲也具有穩(wěn)定性,因此可以作為篡改檢測的依據(jù)。聲音信號經(jīng)過錄音設(shè)備A/D 轉(zhuǎn)換由模擬信號變?yōu)槎M(jìn)制信號,在采集、轉(zhuǎn)換、量化的過程中必然會(huì)引入特定的噪聲,稱之為設(shè)備本底噪聲。不同的設(shè)備的本底噪聲存在差異,通過分析音頻文件本底噪聲的差異性可以判斷音頻信號是否經(jīng)過篡改。由于設(shè)備的各自在生產(chǎn)、組裝、使用過程的不同,會(huì)形成設(shè)備的差異性,可以將設(shè)備本底噪聲理解為這款設(shè)備錄制的音頻所具有的一種特殊水印,可以借鑒數(shù)字音頻主動(dòng)取證的相關(guān)技術(shù)方法檢驗(yàn)。但是對于使用相同錄音設(shè)備錄制的音頻信號的檢測就無能為力。同時(shí)針對環(huán)境的背景噪聲檢驗(yàn)中,頻譜檢驗(yàn)作用明顯,通過對背景噪聲的語譜觀察比較,以發(fā)現(xiàn)二者的異同。
在編輯期間,通常使用相同的背景噪聲樣本來代替語音信號。經(jīng)過比對查找可發(fā)現(xiàn)相同的語音信號,互相復(fù)制粘貼的情況。
1)當(dāng)前,數(shù)字音頻文件真實(shí)性檢驗(yàn)方法不斷發(fā)展,多數(shù)數(shù)字音頻篡改被動(dòng)檢測方法針對性太強(qiáng),通用性不高。音頻篡改檢驗(yàn)還沒有系統(tǒng)的理論模型和方法體系,已有的檢測算法較分散,對音頻篡改檢測方法的研究仍然缺乏整體性的考慮。另外從數(shù)字音頻的產(chǎn)生過程可知,在音頻錄制過程中說話人的狀態(tài)、傳播介質(zhì)的性質(zhì)、錄音設(shè)備的質(zhì)量和錄音環(huán)境的復(fù)雜性等都可能對最后的結(jié)果產(chǎn)生影響。大部分篡改檢測只判斷是否有篡改事實(shí)存在,而對篡改點(diǎn)的準(zhǔn)確定位研究較少。
2)數(shù)字音頻篡改被動(dòng)檢測技術(shù)融合了語音信號分析、數(shù)字信號處理,信息安全、數(shù)值分析、模式識別和機(jī)器學(xué)習(xí)等相關(guān)領(lǐng)域的知識,是一個(gè)多學(xué)科綜合的研究課題。隨著相關(guān)技術(shù)的發(fā)展,未來對數(shù)字音頻篡改被動(dòng)檢測技術(shù)的研究可以參考以下幾個(gè)方面。
(1)完善數(shù)字音頻篡改檢驗(yàn)的理論性研究。數(shù)字音頻篡改被動(dòng)檢驗(yàn)的研究剛起步,還沒有形成系統(tǒng)的有針對性和有效性的檢驗(yàn)方法,還處在探索求證階段。今后應(yīng)不斷完善數(shù)字音頻篡改檢驗(yàn)研究的概念、理論、研究方法等相關(guān)理論;
(2)建立有效的篡改檢驗(yàn)特征表示與描述機(jī)制。即找尋具有與目標(biāo)語音信號相關(guān)聯(lián)的真實(shí)而完整的特征集,同時(shí)構(gòu)建合理、有效的表示描述機(jī)制;
(3)構(gòu)建基于多方法融合的數(shù)字音頻文件被動(dòng)檢驗(yàn)技術(shù),即將已知的并已成功推廣應(yīng)用的技術(shù)和方式進(jìn)行分析整理,融合應(yīng)用,各方法之間互補(bǔ)互相印證。
總之,上述文章中所論述的數(shù)字音頻篡改被動(dòng)檢驗(yàn)方法是一種不基于預(yù)先嵌入的水印信息來進(jìn)行判斷音頻文件是否被篡改的方式方法,已知證據(jù)所具備的可靠而充分的現(xiàn)狀特性則成為該技術(shù)的一個(gè)關(guān)鍵點(diǎn),也是判斷和證明目標(biāo)數(shù)字音頻是否發(fā)生篡改的重要依據(jù)。本文介紹的幾種檢驗(yàn)方法能夠解決部分?jǐn)?shù)字音頻文件的完整性、真實(shí)性的問題,以期數(shù)字音頻文件篡改被動(dòng)檢驗(yàn)方法在案件偵查和法庭訴訟中發(fā)揮更大的作用。