吳世杰
(比亞迪汽車工業(yè)有限公司,廣東深圳 518118)
近年來,由于汽車電子產(chǎn)品技術(shù)的發(fā)展,車載用語音降噪及語音識(shí)別控制的應(yīng)用廣泛。但在車速較快或復(fù)雜路況時(shí),常規(guī)車載通信語音通話的清晰度會(huì)受到影響,從而使得通話雙方無法聽清對(duì)方語音,或可能造成車載語音識(shí)別控制失效。具體而言,在現(xiàn)有汽車電子產(chǎn)品上,一般只能在車載用MIC(Microphone,麥克風(fēng))上加一個(gè)有源電路放大處理輸出信號(hào)。即在普通駐極體MIC接上后,只有放大信號(hào)的處理辦法,而沒有相應(yīng)的語音降噪處理,無法實(shí)現(xiàn)行車環(huán)境噪聲的抑制及分離。而車輛行駛過程中易受環(huán)境影響,造成收集聲源后無法輸出比較清晰的語音信號(hào),進(jìn)而無法滿足在復(fù)雜的行車環(huán)境中使用車載語音電話或進(jìn)行車載語音識(shí)別控制。采用車載麥克風(fēng)降噪模塊與車載多媒體主板分離布置的方案,可以靈活布局麥克風(fēng)降噪模組,使其最佳分布在車箱內(nèi),司乘人員可以體驗(yàn)到最好的語音通話效果。配合百度DuerOS應(yīng)用軟件可以實(shí)現(xiàn)語音識(shí)別實(shí)現(xiàn)語音控制。
語音降噪模塊方案設(shè)計(jì)選用富迪科技的FM1388芯片受控主控ARM芯片+外存貯芯片進(jìn)行讀寫控制,確保固件算法任何時(shí)候都能更新到當(dāng)天最新降噪算法包。FM1388芯片具有2組ADC模擬輸入接口,可以作為模擬信號(hào)輸入,或者接2個(gè)模擬麥克風(fēng)。其THD+N可達(dá)到-92dB,SNR達(dá)到98dB。具有2組DAC模擬輸出接口,THD+N可以到-90dB,SNR達(dá)到101dB。具有2組數(shù)字麥克風(fēng)輸入接口,可以接4個(gè)數(shù)字麥克風(fēng),富迪FM1388回聲消噪算法目前可以支持到3個(gè)麥克風(fēng)同時(shí)工作。具有2組獨(dú)立的I2S/PCM/TDM數(shù)字接口,可以支持24-bit,8~192 kHz。
電路設(shè)計(jì)部分,兩個(gè)DMIC(數(shù)字麥克風(fēng))+ARM+DSP(FM1388)、CAN收發(fā)芯片、DC/DC電源芯片、存貯芯片、音頻協(xié)議傳輸芯片AD2410將I2S轉(zhuǎn)為A2B引線到聯(lián)接器及接口保護(hù)器件組成語音降噪模塊電路.所有被動(dòng)器件選型符合AECQ200規(guī)范,所有芯片選型符合AECQ100規(guī)范。原理設(shè)計(jì)完成后,根據(jù)結(jié)構(gòu)電路板分成2個(gè)板,一個(gè)PCB主板,一個(gè)軟性FPC板。2個(gè)DMIC(數(shù)字麥克風(fēng))用于接收外部聲音信號(hào),通過軟性FPC板接在主板聯(lián)接器到DSP進(jìn)行信號(hào)處理。FPC板聯(lián)接主板裝配在結(jié)構(gòu)件外殼,組裝成語音降噪識(shí)別模塊車載一級(jí)總成件。圖1為語音降噪模塊電路框圖及聯(lián)接器引線定義。
圖1 語音降噪模塊電路框圖及聯(lián)接器引線定義
推薦麥克風(fēng)盡量達(dá)到以下要求:SNR≥60dB;Sensi?tivity:Analog Microphone,-38dB(± 3dB); Digital Micro?phone,-26dB(±3dB)。
對(duì)于麥克風(fēng)的結(jié)構(gòu)設(shè)計(jì)要求:麥克風(fēng)氣密性,需要確保麥克風(fēng)裝進(jìn)機(jī)器后,只有拾音孔可以采到語音。堵住與不堵住麥克風(fēng)拾音孔時(shí),說話測試,可以差別15dB以上。麥克風(fēng)避震性,通常麥克風(fēng)加麥克風(fēng)套,避免機(jī)殼的震動(dòng)直接傳到給麥克風(fēng)。
2個(gè)麥克風(fēng):具有AEC功能,以及穩(wěn)態(tài)噪聲NS功能,具有一定角度的非穩(wěn)態(tài)NS功能。
外接口部分,該產(chǎn)品作為一級(jí)汽車總成件,需要接口線束定義直接并入車載線束使用。語音降噪識(shí)別系統(tǒng)框圖如圖2所示。語音降噪識(shí)別模塊DMIC(數(shù)字麥克風(fēng))安裝位置如圖3所示。
圖2 語音降噪識(shí)別系統(tǒng)框圖
軟件控制部分,ARM啟動(dòng)讀取外存器FALSH芯片的數(shù)據(jù),再賦值DSP啟動(dòng)完成后ARM芯片發(fā)CAN報(bào)文發(fā)送給低速網(wǎng),多媒體主機(jī)接收到報(bào)文后做相關(guān)處理。DMIC(數(shù)字麥克風(fēng))啟動(dòng)工作,由DSP進(jìn)行信號(hào)處理,DSP指令授控于ARM芯片所有核心算法寫入在片外FALSH貯存芯片。由ARM芯片讀FALSH外存芯片再寫入DSP指令,核心算法包放在FALSH外存貯芯片通過后續(xù)不定期升級(jí)確保算法包是最新技術(shù),ARM芯片通過CAN轉(zhuǎn)發(fā)電平芯片并網(wǎng)低速網(wǎng),多媒體可以發(fā)送相關(guān)指令控制并讀取語音降噪模塊總成件數(shù)據(jù)。圖4為語音降噪模塊3個(gè)工作狀態(tài),通過多媒體可以發(fā)送相關(guān)指令可控制不同工作狀態(tài)。
圖3 語音降噪識(shí)別模塊數(shù)字麥克風(fēng)布局圖
圖4 語音降噪模塊工作狀態(tài)
車廂特定區(qū)域內(nèi)裝置2個(gè)以上DMIC(圖3),用于偵測區(qū)域內(nèi)環(huán)境噪聲及區(qū)域內(nèi)人員語音,進(jìn)行比較分析環(huán)境噪聲壓噪及對(duì)人員語音幅值的增益和提升,從而讓用戶體驗(yàn)到有明顯的降噪效果。所述方法包括以下步驟:
(1)當(dāng)DMIC1收集到偵測區(qū)域內(nèi)環(huán)境聲音,DMIC2主要負(fù)責(zé)收集偵測區(qū)域內(nèi)人員的語音,DSP檢測狀態(tài)設(shè)定,分析各DMIC的音量大小再?zèng)Q定是否進(jìn)行壓噪降噪。
(2)當(dāng)聲波首先被DMIC1偵測區(qū)到然后再被DMIC2偵測區(qū)(聲波到達(dá)DMIC1時(shí)間比DMIC2的時(shí)間短),可以判定是環(huán)境聲音收集區(qū),可以進(jìn)行DMIC2區(qū)域人聲進(jìn)行提升,加入頻普分析進(jìn)行關(guān)鍵頻點(diǎn)降增益。進(jìn)行降噪處理。
(3)當(dāng)聲波首先被DMIC2偵測區(qū)到然后再被DMIC1偵測區(qū)(聲波到達(dá)DMIC2時(shí)間比DMIC1的時(shí)間短),可以判定是人員語音收集區(qū),可以進(jìn)行DMIC2區(qū)域人聲進(jìn)行提升,加入頻普分析進(jìn)行關(guān)鍵頻點(diǎn)降增益。不進(jìn)行壓降處理。
圖5所述方法包括以下步驟:
步驟S01,語音降噪模塊開機(jī)自檢成功;
步驟S02,開啟DMIC1~2;
步驟S03,DSP檢測語音關(guān)鍵口令,通過進(jìn)下一步驟S04,不通過當(dāng)有語音口令再進(jìn)行檢測;
步驟S04,檢測是否開啟降噪模式,否進(jìn)入步驟S04,是進(jìn)入步驟S06;
步驟S05,DMIC2增益放大開啟EQ模式;
步驟S06,DMIC1壓制到無窮大同時(shí)DMIC2自動(dòng)調(diào)整增益;
步驟S07,DSP處理編碼I2S格式或差分信號(hào)輸出音頻信號(hào)。
圖5 語音降噪處理流程圖
圖6 語音關(guān)鍵字節(jié)識(shí)別過程圖
從以上語音降噪處理方法可以看出,通過DMIC1—DMIC2分別進(jìn)行采集環(huán)境音源和語音信號(hào),當(dāng)檢測DMIC1&DMIC2比較偵測區(qū)域內(nèi)環(huán)境聲音和人員的語音聲波到達(dá)的時(shí)間及方向確定區(qū)域,用降噪算法,DMIC1信號(hào)音源內(nèi)容進(jìn)行域內(nèi)環(huán)境聲音衰減無窮大,DMIC2信號(hào)音源內(nèi)容進(jìn)行域內(nèi)增益放大,大小會(huì)跟實(shí)際調(diào)試設(shè)定每類型車廂有特定參數(shù)。這樣用戶可以達(dá)到任意行車環(huán)境都可以輸出清漸的語音效果。
圖6為語音關(guān)鍵字節(jié)識(shí)別過程,語音信號(hào)經(jīng)MIC再前置進(jìn)行放大,數(shù)模轉(zhuǎn)換。語音及聲紋識(shí)別處理模試信號(hào)信息特偵(A2I)比較,啟動(dòng)語音標(biāo)簽識(shí)別,喚醒語音識(shí)別系統(tǒng)。從而實(shí)現(xiàn)語音識(shí)別待機(jī)與喚醒的功能。
測試條件:標(biāo)準(zhǔn)凈音房播放標(biāo)準(zhǔn)粉紅白噪聲音源,獲取聲源布局完全按圖3。使用車載多媒體主機(jī)錄下音頻文件。用音頻分析軟件打開可看到音頻幅波圖,可以捉獲音頻幀以時(shí)域角度分析降噪啟動(dòng)時(shí)間。
測實(shí)總結(jié):凈音房播放標(biāo)準(zhǔn)粉紅白噪聲音源,多媒體主機(jī)錄制其音頻,取出音頻文件可以用音頻分析軟件打開看,如圖7所示,降噪功能啟動(dòng)過程及響應(yīng)時(shí)間及壓降噪幅度,相比較壓噪前-2.17dB,降噪后-24.36dB足足降了10倍,可以看到整過壓降過程及明顯的效果。
測試條件:駕駛比亞迪唐,多媒體主機(jī)分別測試加裝語音降噪識(shí)別模塊對(duì)比沒有加裝語音降噪識(shí)別模塊的數(shù)據(jù)。同時(shí)測試使用百度DuerOS版本:1.0錄音寶版本:3.0.1401車載多媒體版本:Android 4.2.2。
使用語句為:導(dǎo)航到深圳圖書館、導(dǎo)航到深圳大學(xué)、開車去深圳市民中心、廣東省深圳市亞迪一村小區(qū)、深圳寶安國際機(jī)場、坪山人民醫(yī)院、廣東省人民醫(yī)院、比亞迪路3009號(hào)、金光華廣場、從白云機(jī)場到廣州南站、從小梅沙到高新科技園、深貿(mào)商業(yè)中心、時(shí)代金融中心、撥移動(dòng)客服、聽FM89.8、今天天氣怎么樣、附近4S店、來首劉德華的歌、我的位置、停車場、最近的肯德基、附近的中餐館、汽車站、最近的服務(wù)區(qū)、售票廳、博物館、度假村、ATM機(jī)、聯(lián)通營業(yè)廳、附近的加油站。
圖7 播放粉紅白噪聲音源音頻圖
表1 語音識(shí)別準(zhǔn)確率測試
測試體驗(yàn)總結(jié):從裝車測試語音識(shí)別成功率查看裝有語音降噪模塊的效果較其他好些,并且通過錄音文件也可以看出語音降噪模塊處理噪聲效果較好,非語音降噪模塊的底噪明顯。特別在汽車行駛過橋洞時(shí)根本聽不清楚。也同時(shí)證明了凈音房播放標(biāo)準(zhǔn)粉紅白噪聲音源,客觀的測試辦法是可行的。
本文作者給出如何設(shè)計(jì)語音降噪識(shí)別模塊及系統(tǒng)的方案、降噪過程實(shí)現(xiàn)的方法、實(shí)驗(yàn)室測試數(shù)據(jù)及裝車路測的數(shù)據(jù)對(duì)比,實(shí)現(xiàn)車載多媒體語音降噪及提升語音識(shí)別率,裝有語音降噪模塊比沒有加裝語音降噪模塊,有明顯的提升,從實(shí)驗(yàn)室數(shù)據(jù)與裝車路測數(shù)據(jù)對(duì)比,更好地證明該方案的可行性。分析比對(duì)數(shù)字麥克風(fēng)陣列布局及選型的理論,結(jié)合降噪算法,解決單個(gè)注極體麥克風(fēng)容易環(huán)境振動(dòng)的缺點(diǎn),選用數(shù)字麥克風(fēng)陣列布局可鎖定收音區(qū)域,解決人聲跟蹤的難題。這樣的技術(shù)方案明顯可提高語音識(shí)別率。