(Driver Behavior State Recognition based on Silence Removal Speech)
許多研究將駕駛員行為與事故原因聯(lián)系起來,有些研究重點分析了基于駕駛員行為狀態(tài)所造成事故的預(yù)防措施。根據(jù)大量的研究發(fā)現(xiàn),語音已經(jīng)被發(fā)現(xiàn)是識別和分析駕駛員行為狀態(tài)的合適的輸入信號,因為當(dāng)駕駛員說話時系統(tǒng)可以測量潛在的情緒信息,同時也可以測量這種情緒上的改變所帶來的輸入信號上的改變。
在提取相關(guān)語音特征之前,本文提出了一種使用短期能量(STE)和零交叉率(ZCR)的靜音消除方法,以減少語音信號在車輛環(huán)境中的計算時間。采用梅爾頻率倒譜系數(shù)(MFCC)特征提取方法,結(jié)合多層感知器與分類器獲取駕駛員行為狀態(tài)識別性能。MFCC在人類聽覺頻率響應(yīng)中應(yīng)用了耳蝸機制,該機制利用一定數(shù)量的系數(shù)濾波器組和特定的形狀濾波器組。這些特征捕捉音頻信號的頻譜包含了感知最重要的部分,然后將這些信息解釋為腦解碼的神經(jīng)沖動。然而,在某些駕駛行為中,數(shù)據(jù)往往是不準確的、可調(diào)整的或有明顯缺陷的,并且有可能包含許多噪聲和偽影。因此,需要對一個干凈的數(shù)據(jù)進行分析,以確保觀察結(jié)果來自正確的數(shù)據(jù)。通常,我們可以用預(yù)處理來保證噪音和偽影的最小化甚至實現(xiàn)去除。預(yù)處理是對原始數(shù)據(jù)執(zhí)行子流程的過程,用于特征提取和分類階段的準備。
檢測靜音區(qū)域的兩種最常用的方法是采用零交叉率(ZCR)和短時能量(STE)方法。ZCR是在給定的時間間隔/幀中對語音信號的幅度通過零值次數(shù)的度量,短期能量(STE)可以定義為特定語音段內(nèi)幅度的平方絕對值之和。這兩種方法均能有效的用來消除噪音從而獲得有效的聲音信號。