李運 趙凱
摘? 要:為了依法有效提取音頻資料證據(jù),保護人民群眾合法權(quán)益和財產(chǎn)安全,在法律和技術(shù)層面研究音頻資料作為證據(jù)的有效提取方法。首先在實戰(zhàn)部門進行調(diào)研,并完成模擬場景實驗分析,然后設(shè)計了包含真實環(huán)境、實戰(zhàn)裝備、人物場景模擬等復(fù)雜場景實驗條件,接著進行了多場景基于音頻資料的語譜圖實驗分析總結(jié),最終獲得有效的音頻提取方法,并形成一套應(yīng)用較強的提取規(guī)范。研究總結(jié)的方法和規(guī)范可運用到公安實戰(zhàn)工作中,符合執(zhí)法規(guī)范,可操作性強,獲取的音頻資料證據(jù)有效,實戰(zhàn)價值高。
關(guān)鍵詞:證據(jù);音頻資料;語譜圖;有效提取
中圖分類號:TN912.3 文獻標志碼:A? ? ? ? ?文章編號:2095-2945(2020)27-0035-03
Abstract: This paper studies the effective extraction method of audio data as evidence. The purpose of the research is to extract audio data evidence effectively and protect people's legitimate rights and property safety. First of all, the investigation is carried out and the simulation scene experiment is analyzed. Then, the complex experimental scene conditions are designed. And it contains the real environment, combat equipment, character scene simulation and other content. Second, the paper analyzes and summarizes the multi-scene speech spectrogram based on audio data. Finally, this paper obtains an effective audio extraction method, and forms a set of extraction specifications with strong application. The methods can be applied to the actual work of the public security, which are in line with the law enforcement norms, with strong operability and high practical value.
Keywords: evidence; audio data; speech spectrum; effective extraction
1 概述
在2018年新修正的《中華人民共和國刑事訴訟法》第五章證據(jù)中的第五十條中,視聽資料被列為第八種證據(jù)。說明證據(jù)必須經(jīng)過查證屬實,才能作為定案的根據(jù),凸顯了視聽資料的重要性,同時也表明視聽資料作為證據(jù)必須查證屬實,也就是通常所說的有效,才能作為證據(jù)。
隨著信息技術(shù)的迅猛發(fā)展,指紋、人臉識別、聲紋等生物特征識別技術(shù)被廣泛應(yīng)用于公安機關(guān)案件偵破工作中。隨著便攜式錄音設(shè)備越來越普及,音頻資料作為證據(jù)的一種,能夠反映案件發(fā)生過程中的事實,但音頻資料在查證和檢驗鑒定過程中,對音頻資料的錄制和采集也提出了一定的挑戰(zhàn)。為了達到訴訟要求,音頻資料必須進行檢驗鑒定,在檢驗鑒定過程中,發(fā)現(xiàn)很多音頻資料受到了質(zhì)疑,有些是沒有獲取到關(guān)鍵信息,有些是存在噪聲過大,無法檢驗,有些是在轉(zhuǎn)存或證據(jù)采集過程中真實性或完整性遭到破壞。在公安工作中音頻證據(jù)重要性日漸凸顯,如何保證有效地收集音頻證據(jù)成為公安“電子數(shù)據(jù)”證據(jù)走向科學化、規(guī)范化的中重要關(guān)鍵一環(huán),研究如何規(guī)范化收集有效音頻證據(jù)應(yīng)對日?;鶎庸补ぷ髦陵P(guān)重要。
2 音頻資料研究現(xiàn)狀
對于音頻資料的檢驗鑒定,在司法語音業(yè)界內(nèi)稱之為“聲紋”鑒定,主要包含兩方面的內(nèi)容,音頻資料的同一性鑒定和音頻資料的真實性鑒定。聲紋作為人類生物特征的一種,是每個人語音聲學特征圖譜的集合[1]。每個人的聲紋是個體的長期穩(wěn)定的語音特征信號,聲紋鑒定就是把未知人的語聲和已知人的語聲,通過語圖儀分別制成聲紋圖譜,再依據(jù)聲紋圖上的特征進行分析、比較和判斷,完成音頻資料的檢驗鑒定。
在音頻資料的檢驗鑒定中,針對音頻資料作為證據(jù)當成審判的依據(jù),其有效的提取研究相對較少。音頻資料的提取方法和技巧的研究是聲紋鑒定技術(shù)與公安業(yè)務(wù)工作相結(jié)合的研究課題。在音頻資料的檢驗鑒定中,一般經(jīng)司法行政機關(guān)進行委托,再獲得司法鑒定資格的鑒定機構(gòu)進行檢驗鑒定。在檢驗鑒定工作中,發(fā)現(xiàn)司法行政機關(guān)提供的音頻資料,常出現(xiàn)不規(guī)范、失效等問題,這也是由于業(yè)務(wù)部門欠缺對音頻資料的提取和保存的相關(guān)技術(shù)研究和培訓??偟膩碚f,目前實戰(zhàn)單位關(guān)于音頻資料的相關(guān)應(yīng)用較多,但研究實戰(zhàn)規(guī)范性和有效性研究還較薄弱。
3 語音頻譜在音頻資料有效性檢驗中的運用
在我國的聲紋檢驗鑒定中,聲紋鑒定過程通過綜合分析判斷聽覺評價、語音頻譜比較和定量比對分析,得出檢驗鑒定的結(jié)論。無論是在同一性檢驗和真實性檢驗中,語音的頻譜分析都是重要的檢驗鑒定環(huán)節(jié)。在語音的頻譜分析中,使用的最主要的圖譜就是語音的寬帶語譜圖。語音的寬帶語譜圖,主要采用了“短時分析技術(shù)”,將語音的時間、強度和頻譜信息綜合在一起形成的圖譜,主要反映了話語人語音的共振峰特征信息。
語音共振峰反映聲道諧振特性的重要特征,是聲紋檢驗鑒定中的重要特征參數(shù),包含了話語人的生物特征和行為特征的重要信息。共振峰中心的高低、濃淡和寬窄等參數(shù)表示了語音的音延(duration)、音頻(frequency)和音強(intensity)等因素的變化。聲道中的共鳴作用使一個音的加強區(qū)有別于另一個音的加強區(qū),共振峰在頻譜圖上顯示為水平方向的黑帶,共振峰的形態(tài)和條數(shù)是檢驗鑒定中的重要參數(shù)。
在音頻資料同一性鑒定分析中,認定同一的鑒定結(jié)論就需要以下內(nèi)容作為支撐:此結(jié)論要求檢材、樣本中可供比對的音節(jié)有10個以上,每個音節(jié)有3條以上有效共振峰;所有可供比對音節(jié)的特征符合率超過90%?;蛘呖晒┍葘Φ囊艄?jié)有6個以上,一般是一個句子,每個音節(jié)有4條以上有效共振峰,特征符合率超過95%。如果檢材、樣本有偽裝,則不能下此結(jié)論。由此可以看出,每個音節(jié)中的有效共振峰的條數(shù)是同一性檢驗鑒定的主要因素。為了達到檢驗鑒定的目的,音頻資料有效提取的首個重要參數(shù)就是共振峰的條數(shù)。
在音頻資料完整性檢驗鑒定分析中,頻譜的檢驗也是至關(guān)重要的。對頻譜的連續(xù)性和完整性的分析檢驗是檢驗結(jié)論的重要支撐。
4 語音有效提取的實驗和分析
為貼近實戰(zhàn),總結(jié)不同場景中語音有效提取的難點和要點,通過模擬場景方法,獲取兩個比較典型的場景案例進行分析總結(jié)。第一個場景是公共場所,如火車站、廣場和餐廳等背景比較嘈雜的場景。第二個場景是室內(nèi)環(huán)境,如小區(qū)房、寫字樓、密閉酒店背景較為安靜場景。
為達到一線民警較容易進行分析的目的,實驗軟件分析沒有采用專業(yè)的司法語音鑒定軟件,而采用較容易獲取的語音分析軟件praat進行語音頻譜分析,達到了預(yù)期實驗?zāi)康摹O旅鎸⑼ㄟ^兩個部分分別對兩個不同場景的實驗數(shù)據(jù)進行分析總結(jié)。
4.1 嘈雜公共場所的語音有效提取和分析
在嘈雜的公共場所完成語音提取難度較大,主要是由于嘈雜的公共場所語音的混響較大和不確定的隨機噪聲較多兩個因素。為達到較好的實驗效果,采用模擬場景的實驗方法。模擬乘車人員和工作人員由于糾紛產(chǎn)生爭吵的場景。鐵路民警在控制現(xiàn)場、排解糾紛過程中,王某情緒激動,周圍圍觀人員較多,并使用隨身攜帶的維修工具將民警打傷,但在被制服后,說民警先對其進行無端毆打,被迫自衛(wèi)還手。由于現(xiàn)場混亂隨身攜帶警用執(zhí)法儀器在勸阻過程中被打落,因此現(xiàn)場的錄音成為還原事件的關(guān)鍵證據(jù)。
實驗選取了語音中的“犯罪”兩個字作為分析對象,將在上述模擬場景中的語音檢材與同樣環(huán)境但噪聲較小時獲取語音檢材的圖譜數(shù)據(jù)進行對比。圖1是模擬場景中提取到的語音檢材語譜圖。圖1語譜圖中有高音強噪聲,時域圖譜中有明顯噪聲波形,頻譜中噪聲圖譜充滿整個圖譜頻域。圖2語譜圖中噪聲較小,圖譜清晰。圖1在噪聲條件下關(guān)鍵語音圖譜被噪聲覆蓋且不滿足有效共振峰的個數(shù),提取的音頻資料不能作為證據(jù),屬音頻資料的無效提取。圖2噪聲環(huán)境較小,關(guān)鍵語音圖譜清晰,且具備三條以上的有效共振峰條件,屬音頻資料的有效提取。根據(jù)多次反復(fù)實驗,在高音強噪聲環(huán)境下,提取的音頻資料中的關(guān)鍵語句60%以上共振峰數(shù)目不足或存在語音重疊的情況,不能作為有效證據(jù)[2]。
當案件發(fā)生地點出現(xiàn)在這類特殊噪聲環(huán)境中時,公安執(zhí)法人員應(yīng)當首先勸離圍觀群眾,形成一定執(zhí)法區(qū)域或在環(huán)境噪聲較小場地進行執(zhí)法,執(zhí)法過程中應(yīng)減少多人同時說話造成的語音重疊,維持雙方的對話秩序。當外界自然狀態(tài)音頻(比如火車站火車鳴笛聲)振動無法規(guī)避時,公安人員應(yīng)按照公安部關(guān)于印發(fā)《公安機關(guān)現(xiàn)場執(zhí)法視音頻記錄工作規(guī)定》規(guī)范進行音頻收集,同時在保障自身安全的前提下進行音頻證據(jù)的獲取,最重要的是需要執(zhí)法人員在音頻證據(jù)提取時一定要保留原始載體,避免錄音證據(jù)證明力不足的情況[3]。特殊情況下執(zhí)法人員可收集相應(yīng)環(huán)境下的噪音數(shù)據(jù),并移交司法鑒定部門使用音頻資料處理技術(shù)手段,對噪聲進行分解去除,提高辦案效率和司法部門的鑒定效率[4]。
4.2 安靜場景中語音有效提取分析
在較安靜場景下對音頻資料提取的有效性影響較小。音頻資料的有效提取關(guān)鍵在于聲源距離和角度、執(zhí)法規(guī)范、關(guān)鍵信息獲取、錄音設(shè)備等[5]。案件發(fā)生時,執(zhí)法人員作為主動取證方,應(yīng)執(zhí)法規(guī)范,保持與被采集人盡量近的距離,遠離噪聲源,合理調(diào)動被采集人的情緒,運用較好的音頻資料錄制設(shè)備。
實驗?zāi)M某民警住宅房間內(nèi)執(zhí)法的情景,在執(zhí)法過程中某男不滿執(zhí)法結(jié)果,公然妨礙民警執(zhí)法,使用侮辱性詞匯攻擊民警,并動手推搡執(zhí)法人員,導(dǎo)致民警手部挫傷,執(zhí)法記錄儀掉落。在回看執(zhí)法視頻時,由于民警距離該男距離稍遠,錄音角度沒有正對,且執(zhí)法儀被打落于沙發(fā)下,導(dǎo)致推搡視頻未被錄上。同樣場景下,民警應(yīng)保持與該男合理距離和角度,冷靜控制該男情緒,發(fā)生肢體接觸時有效保護執(zhí)法記錄儀。
通過兩個不同場景實驗,對音頻資料中的“混蛋”一詞進行對比分析。圖3為前一場景下獲取的音頻資料。語音圖譜分析范圍在0-5000Hz,“混”音長約1.57s。圖3中,聲源距離較遠、錄音角度未正對時,語圖中“混”的音強很小,寬帶語圖不清晰,檢測不出共振峰。圖4為后一場景下獲取的音頻資料。語音圖譜分析范圍在0-5000Hz,“混”音長約1.76s。圖4中,聲源距離和角度合適,語圖中“混”的音強較大,寬帶語圖清晰,共振峰大于3條。分析上述兩種場景,圖3場景中關(guān)鍵語句音強較小,混響較大,共振峰不清晰,條數(shù)不滿足鑒定條件。圖4場景中,關(guān)鍵語句音強較大,語圖清晰,共振峰條數(shù)滿足鑒定條件。
安靜場景中對音頻資料提取時,有效提取難度較小,但也存在無效提取的現(xiàn)象。執(zhí)法人員首先要注意保持執(zhí)法記錄儀的狀態(tài)穩(wěn)定,在音頻資料提取中要注意以下幾點。第一與聲源的距離合適,角度要正對;第二執(zhí)法規(guī)范,控制對方情緒;第三語音不能重疊,關(guān)鍵信息反復(fù)詢問;第四保持執(zhí)法記錄儀的正常狀態(tài)。
根據(jù)上述典型實驗和數(shù)據(jù)對比分析,執(zhí)法人員在采集音頻資料作為證據(jù)時應(yīng)當注意的規(guī)范包括[6]:(1)確定收集犯罪嫌疑人表達其犯罪的內(nèi)容;(2)避免語音重疊,盡量讓犯罪嫌疑人發(fā)聲;(3)引導(dǎo)犯罪嫌疑人重復(fù)關(guān)鍵信息;(4)
確保犯罪嫌疑人語義連貫;(5)遠離產(chǎn)生噪聲的物體;(6)防止錄音設(shè)備震動導(dǎo)致錄音中斷;(7)錄音距離在保證自
身安全的情況下,接近犯罪嫌疑人。
為了避免丟失較多共振峰特征,達到音頻資料的有效提取,錄音設(shè)備選用規(guī)范為[7]:(1)選擇PCM無損編碼格式;(2)采樣率大于8kHz;(3)含有動圈麥克風,如果室內(nèi)環(huán)境工作辦案多于室外環(huán)境選擇電容麥克風,電容麥克風抗阻指數(shù)參照100-250Ω,電容麥克風抗阻指數(shù)參照500-550Ω;(4)頻率范圍參照20-10kHz;(5)動態(tài)范圍達60dB。
5 結(jié)束語
本文研究了音頻資料在證據(jù)中的作用,分析了語音頻譜在音頻資料有效性檢驗中的運用,運用模擬場景方法通過對音頻資料的有效提取進行了實驗,總結(jié)了音頻資料采集和有效提取時的注意事項和一般規(guī)范。通過音頻資料的有效提取,可還原案件發(fā)生時真實場景,提高執(zhí)法人員執(zhí)法時的工作效益,推動公安工作的執(zhí)法規(guī)范進程,促進以“審判為中心”的注重證據(jù)的司法制度改革。
參考文獻:
[1]王英利,李敬陽,曹洪林.聲紋鑒定技術(shù)綜述[J].警察技術(shù),2012(4):53-56.
[2]何少巖,陳蕉容,陳舜兒.基于錄制環(huán)境檢測的數(shù)字音頻取證研究[J].計算機工程與設(shè)計,2013(12):4142-4145.
[3]楊銳.數(shù)字音頻取證方法研究[D].廣州:中山大學,2010.
[4]賈麗雯.芻議聽音與司法鑒定[J].湖北警察學院學報,2013(4):183-185.
[5]黃曉丹.音頻司法鑒定的研究[D].廈門:廈門大學,2012.
[6]黃燕芳.聲紋樣本收集過程中存在的問題和解決方法[J].鐵道警察學院學報,2007(10):95-96.
[7]秦天蕓.加性噪聲下錄音設(shè)備來源取證研究[D].寧波:寧波大學,2019.