亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于雙麥克風(fēng)降噪技術(shù)的語音識別系統(tǒng)

        2016-04-12 00:00:00潘麗杰徐本亮朱琪王利峰繆惠根
        現(xiàn)代電子技術(shù) 2016年2期

        摘 要: 語音控制是智能化設(shè)備的重要控制手段,而語音識別是實(shí)現(xiàn)語音控制的關(guān)鍵技術(shù)。為了設(shè)計(jì)一種可靠的、抗干擾性強(qiáng)的產(chǎn)品,提出了一種基于雙麥克風(fēng)降噪技術(shù)的語音識別系統(tǒng)。該設(shè)計(jì)運(yùn)用ROHM公司的BU8332KV芯片作為語音識別前端處理的核心,利用其雙麥克風(fēng)降噪技術(shù)來解決語音識別中的噪聲問題,結(jié)合單片機(jī)和語音識別芯片,應(yīng)用于按摩椅的語音控制系統(tǒng)中。經(jīng)過非特定人的語音識別系統(tǒng)的靜態(tài)和噪聲環(huán)境下測試,結(jié)果表明在噪聲環(huán)境下,該系統(tǒng)有較高的識別率,適用于按摩椅的應(yīng)用環(huán)境,也適合在其他有環(huán)境噪聲干擾的語音識別系統(tǒng)中推廣應(yīng)用。

        關(guān)鍵詞: 語音識別; 語音控制; 雙麥克風(fēng)降噪; BU8332KV

        中圖分類號: TN912?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2016)02?0137?03

        Speech recognition system based on dual?microphone noise reduction technology

        PAN Lijie, XU Benliang, ZHU Qi, WANG Lifeng, MIAO Huigen

        (Yangtze Delta Region Institute of Tsinghua University, Jiaxing 314000, China)

        Abstract: With the speech control as an important control means of intelligent device, and speech recognition as a key technology to realize the speech control, a speech recognition system based on double?microphone noise reduction technology is proposed for the design of a reliable, strong anti?interference product. In the design of a voice control system in massage chair, BU8332KV chip of ROHM Company is taken as the core of speech recognition front?end processing, the dual?microphone noise reduction technology is adopted to solve the problem of noise in speech recognition, and MCU and speech recognition chip are combined. The testing result of speaker independent speech recognition system in static and noise environment test proves that the system has a high recognition rate, and is suitable for the application environment of massage chair. It is also suitable for popularization and application to other speech recognition systems working in environmental noise interference.

        Keywords: speech recognition; speech control; dual?microphone noise reduction; BU8332KV

        0 引 言

        近年來,隨著語音識別技術(shù)的日益發(fā)展,語音輸入系統(tǒng)廣泛應(yīng)用于以汽車導(dǎo)航儀及智能手機(jī)為首的移動設(shè)備上,今后還將要擴(kuò)展到其他智能電氣產(chǎn)品。語言是人類傳遞信息的主要手段,語音識別技術(shù)是目前世界上最熱門和最具發(fā)展前景的新型信息技術(shù)之一[1?2]。采用語音識別作為人機(jī)接口的設(shè)備能夠具有簡便、快捷、靈活的優(yōu)點(diǎn),其在軍事、民用和商業(yè)領(lǐng)域都發(fā)揮了巨大的作用,在未來會成為新一代操作系統(tǒng)的接口[3?5]。

        在語音識別過程中,不可避免會受到其他噪聲影響,比如周圍環(huán)境中的噪聲,別人講話的聲音等,這樣,最終接收到的已經(jīng)不是純凈的語音信號,而是有干擾的帶噪語音,常規(guī)的做法就是通過增強(qiáng)、增大語音信號來解決,比如提高嗓門,或近距離說話,這樣極大地影響了使用效果。所以在前端對語音進(jìn)行降噪處理非常必要,也是語音識別的最重要部分,能夠?yàn)檎麄€(gè)語音識別系統(tǒng)提供可靠的穩(wěn)定性,提高其識別率。

        本文以ROHM公司的BU8332KV芯片作為語音識別前端處理的核心,利用其雙麥克風(fēng)降噪技術(shù)來解決語音識別中的噪聲問題。

        1 雙麥克風(fēng)降噪技術(shù)

        1.1 技術(shù)原理

        BU8332KV芯片采用波束賦形技術(shù)形成指向性,因?yàn)閷⒅赶蜉S轉(zhuǎn)向聲源的方向,所以大大降低了環(huán)境噪音。這里的波束賦形技術(shù)是利用多個(gè)麥克風(fēng)的相位差,降低目標(biāo)方向以外的語音的技術(shù)。其降低了環(huán)境噪音,提高了目標(biāo)聲源的清晰度。通過噪音抑制的功能,進(jìn)一步降低殘留在指向軸方向的固定噪音。這個(gè)技術(shù)和僅僅使用噪音消除的技術(shù)不同,可以更加強(qiáng)調(diào)聲源。而且,由于它能夠在僅僅10 mm的窄間距上安裝2個(gè)麥克風(fēng),所以能夠內(nèi)置于以智能手機(jī)為代表的各種小型設(shè)備上。通過最優(yōu)化處理,波束賦形技術(shù)可以將使用時(shí)的處理延遲時(shí)間控制在10 ms以下,使得將其他應(yīng)用程序的影響控制在最小限度內(nèi)。通過這些措施,有助于提高各種設(shè)備的語音識別率和改善免提的通話質(zhì)量,雙麥克風(fēng)降噪工作示意圖如圖1所示。

        圖1 雙麥克風(fēng)降噪工作示意圖

        使用兩個(gè)麥克風(fēng)形成指向性的技術(shù)早已被應(yīng)用,但現(xiàn)有技術(shù)為了提高指向性,必須拉長麥克風(fēng)間距,所以不能適應(yīng)小型便攜式設(shè)備的搭載要求。另外,數(shù)字信號處理的延遲時(shí)間及音質(zhì)劣化,也是今后繼續(xù)要攻克的研究課題。而如今,利用波束賦形技術(shù)形成指向性,并且通過把指向軸轉(zhuǎn)向聲源方向,從而衰減了聲源以外的語音。在指向軸方向殘留的固定噪音通過噪音抑制的功能得以降低,因而使得聲源變得清晰。其結(jié)果是使得背面方向的衰減量較傳統(tǒng)的麥克風(fēng)改善30 dB以上。

        1.2 技術(shù)特點(diǎn)

        (1) 敏銳指向性可以更加清晰地拾取聲源。獨(dú)有的信號處理技術(shù)與以往麥克風(fēng)比較,實(shí)現(xiàn)了敏銳的指向性,進(jìn)行聲音的清晰度處理。聲源方向(0°)對于背面方向(180°)的衰減量與以往的麥克風(fēng)比較大幅度改善30 dB以上。此外,還可以實(shí)現(xiàn)10 mm安裝間距,如圖2所示。

        圖2 BU8332KV?M與以往麥克風(fēng)指向性特點(diǎn)的比較

        (2) 大幅度提高語音識別率??梢允拐Z音不劣化,能降低環(huán)境噪音。因此,提高在環(huán)境噪音條件下的語音識別率。通過檢測,在環(huán)境噪音等級55 dBSPL的環(huán)境下的語音識別精度從5%提高到90%。未使用時(shí),噪音等級為55 dBSPL,識別率急劇下降;使用時(shí),即使噪音等級為65 dBSPL,也可以實(shí)現(xiàn)45%的識別率。

        圖3 使用BU8332KV?M時(shí)的語音識別精度

        2 硬件電路設(shè)計(jì)

        2.1 總體結(jié)構(gòu)設(shè)計(jì)

        整個(gè)系統(tǒng)的硬件電路主要包括語音處理和語音識別兩個(gè)模塊。語音處理模塊主要為BU8332KV芯片電路,語音識別模塊主要為STC10L08XE單片機(jī)和LD3320語音識別芯片電路。系統(tǒng)的實(shí)現(xiàn)方框圖如圖4所示。

        圖4 系統(tǒng)總體結(jié)構(gòu)框圖

        2.2 語音處理部分

        該部分采用ROHM公司的BU8332KV芯片。 該芯片采用波束賦形技術(shù)形成指向性,因?yàn)閷⒅赶蜉S轉(zhuǎn)向聲源的方向,所以大大降低了環(huán)境噪音。通過噪音抑制的功能,進(jìn)一步降低殘留在指向軸方向的固定噪音。這個(gè)技術(shù)和僅僅使用噪音消除的技術(shù)不同,可以更加強(qiáng)調(diào)聲源,通過最優(yōu)化處理,然后將降噪后的語音輸入到LD3320中。該技術(shù)的其他功能如下:使用波束賦形技術(shù)功能時(shí)的處理延遲時(shí)間為10 ms以下;搭載降低殘留在軸向指向方向的固定噪音的噪音抑制功能;模擬輸出(LINEOUT)或者數(shù)字輸出(PCM接口);可用3.3 V的單系統(tǒng)工作(內(nèi)置核心電源調(diào)節(jié)器);內(nèi)置有麥克風(fēng)用偏壓、前置放大器的電路;雙線主機(jī)接口;可以單機(jī)工作(內(nèi)置E2PROM用SPI接口)。

        2.3 語音識別模塊

        LD3320內(nèi)部通過快速而穩(wěn)定的優(yōu)化算法,完成非特定人語音識別,不需要用戶事先訓(xùn)練和錄音,不需要外接任何輔助的FLASH芯片,RAM芯片和A/D芯片[6?7],就可以完成語音識別功能;因此LD3320的語音識別率準(zhǔn)確率比較高,也比較穩(wěn)定。LD3320芯片內(nèi)部的語音識別原理框圖[5?6]如圖5中的圓角矩形框內(nèi)所示。

        圖5 語音識別原理框圖

        LD3320芯片與STC10L08XE單片機(jī)采用并行方式相接,單片機(jī)先將關(guān)鍵詞列表發(fā)送給LD3320。語音識別的過程也是語音識別芯片完成的工作:把通過語音處理模塊的語音流進(jìn)行頻譜分析,提取其中的語音特征,再和列表中的關(guān)鍵詞語進(jìn)行匹配,找出得分最高的關(guān)鍵詞語作為識別結(jié)果輸給單片機(jī),單片機(jī)播放對應(yīng)的提示音。

        3 性能測試與應(yīng)用

        本文所設(shè)計(jì)的語音識別系統(tǒng)主要用在語音控制按摩椅,在應(yīng)用中最主要關(guān)注的是識別率以及實(shí)時(shí)性。為了檢測識別效果,實(shí)驗(yàn)中選取幾個(gè)不同音色的人在實(shí)驗(yàn)室安靜環(huán)境下和加60 dB噪音環(huán)境下分別進(jìn)行多組詞語測試,每個(gè)測試50遍。兩種環(huán)境下部分語音命令測試的正確識別數(shù)據(jù)比例如表1、表2所示。

        由表1、表2可知在實(shí)驗(yàn)室安靜環(huán)境下,對于測試的語音命令平均識別率可達(dá)91.5%,在噪音環(huán)境下可達(dá)68%。兩種環(huán)境下對單個(gè)語音命令處理后的波形如圖6、圖7所示。

        4 結(jié) 語

        噪聲環(huán)境中的語音識別是當(dāng)前語音信號處理領(lǐng)域的研究難點(diǎn)。本設(shè)計(jì)運(yùn)用ROHM公司的BU8332KV芯片作為語音識別前端處理的核心;利用其雙麥克風(fēng)降噪技術(shù)來解決語音識別中的噪聲問題;運(yùn)用單片機(jī)和非特定人語音識識別芯片LD3320,完成了語音控制系統(tǒng)的語音識別模塊的軟硬件設(shè)汁。實(shí)驗(yàn)結(jié)果表明,基于雙麥克風(fēng)降噪技術(shù)的語音識別系統(tǒng),對于語音命令的平均識別率可達(dá)90%,在噪音干擾下也有著65%以上的識別率。本系統(tǒng)抗噪聲能力強(qiáng),其雙麥克風(fēng)可以近距離安裝,可以使系統(tǒng)小型化,通用化,隨著智能產(chǎn)品的普及,該系統(tǒng)將有廣泛的應(yīng)用前景。

        表1 安靜環(huán)境下正確識別數(shù)據(jù)表

        表2 60 dB噪音環(huán)境下正確識別數(shù)據(jù)表

        圖6 安靜環(huán)境下語音處理后輸出的語音波形

        (上接第139頁)

        圖7 60 dB噪音環(huán)境下語音處理后輸出的語音波形

        參考文獻(xiàn)

        [1] 劉幺和,宋庭新.語音識別與控制應(yīng)用技術(shù)[M].北京:科學(xué)出版社,2008.

        [2] 趙力.語音信號處理[M].2版.北京:機(jī)械工業(yè)出版社,2009.

        [3] 張晨燕,孫成立.非特定人孤立詞語音識別系統(tǒng)的片上實(shí)現(xiàn)[J].計(jì)算機(jī)工程與應(yīng)用,2007,43(13):194?196.

        [4] 關(guān)勝平,何培宇,劉珂含,等.基于TMS320VC5509A的語音識別與控制系統(tǒng)[J].電子技術(shù)應(yīng)用,2007,33(7):36?39.

        [5] 孫兵.基于單片機(jī)的機(jī)械手聲控系統(tǒng)設(shè)計(jì)[J].機(jī)械工程與自動化,2007(6):113?114.

        [6] 佚名.LD332X語音識別芯片[EB/OL].[2010?07?01].http://www.icroute.com/web_cn/LD332X.html.

        [7] 佚名.LD3320芯片簡明調(diào)試步驟[EB/OL].[2010?07?01].http://www.icroute.com/web_cn/LD332X_DebugProcess.html.

        天堂网站一区二区三区| 91精品综合久久久久m3u8| 亚洲第一页综合av免费在线观看| 国模91九色精品二三四| 人妻av无码一区二区三区| 欧美日韩不卡视频合集| yw193.can尤物国产在线网页| 蜜桃在线高清视频免费观看网址| 天天做天天摸天天爽天天爱 | 极品嫩模大尺度av在线播放| 精品成人av一区二区三区| 99精品一区二区三区免费视频| 国产成人激情视频在线观看| 虎白女粉嫩粉嫩的18在线观看| 插b内射18免费视频| 久久综合色鬼| 久草视频在线视频手机在线观看| 女同同性av观看免费| 久久久久久亚洲精品中文字幕| 国产免费一区二区三区最新不卡| 美国又粗又长久久性黄大片| 日本亲近相奷中文字幕| 性色av无码一区二区三区人妻| 在线观看精品国产福利片87| 国产精品自拍午夜伦理福利| 色综合av综合无码综合网站| 99精品视频69V精品视频| 久久国内精品自在自线图片| 美女裸体无遮挡免费视频的网站| 久草视频在线视频手机在线观看| 色翁荡息又大又硬又粗视频| 国产精品白浆在线观看无码专区| 激情 一区二区| 亚洲丰满熟女一区二亚洲亚洲| 特黄做受又粗又长又大又硬| 中文字幕天堂在线| 亚洲熟女一区二区三区不卡| 男女18禁啪啪无遮挡激烈网站| 免费国精产品自偷自偷免费看| 五码人妻少妇久久五码| 人妻少妇不满足中文字幕|