亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        LD3320的嵌入式語音識別系統(tǒng)的應(yīng)用

        2012-06-25 02:45:54洪家平
        關(guān)鍵詞:遙控器列表關(guān)鍵

        洪家平

        (湖北師范學(xué)院 計算機科學(xué)與技術(shù)學(xué)院,黃石 435002)

        洪家平(副教授),主要研究方向是嵌入式系統(tǒng)應(yīng)用、計算機控制技術(shù)。

        1 概 述

        在現(xiàn)代社會,“懶人科技”大行其道。當(dāng)面臨眾多繁瑣的按鍵操作和菜單選擇的時候,簡單地說出指令,是最具有人情味的人機操作界面。讓身邊的各種電子設(shè)備可“聽從”人類的語音,是從電影“星球大戰(zhàn)”就開始的科技發(fā)展目標(biāo)。雖然目前的科技還不能做到讓計算機完全理解人類的所有自然語音,但是可以在一定程度上實現(xiàn)這個夢想。

        2 特定人語音識別技術(shù)及原理

        特定人語音識別 (ASR,Auto Speech Recognition)技術(shù)是基于“關(guān)鍵詞語列表”的識別技術(shù),它是對大量的語音數(shù)據(jù)(相當(dāng)于對數(shù)千人采集的數(shù)萬小時的有效聲音數(shù)據(jù))經(jīng)語言學(xué)家語音模型分析,建立數(shù)學(xué)模型,并經(jīng)過反復(fù)訓(xùn)練提取基元語音的細(xì)節(jié)特征,以及提取各基元間的特征差異,得到在統(tǒng)計概率最優(yōu)化意義上的各個基元語音特征,最后才由資深工程師將算法以及語音模型轉(zhuǎn)換成硬件芯片并應(yīng)用在嵌入式系統(tǒng)中。

        ASR技術(shù)每次識別的過程就是把用戶說出的語音內(nèi)容,通過頻譜轉(zhuǎn)換為語音特征,再將這個轉(zhuǎn)換后的語音特征和“關(guān)鍵詞語列表”中的條目一一進(jìn)行匹配,最優(yōu)匹配的一條即作為識別結(jié)果。比如ASR技術(shù)在語音控制的手機應(yīng)用中,這個“關(guān)鍵詞語列表”的內(nèi)容就是電話本中的人名、手機的菜單命令或手機存儲卡中的歌曲名字。不論這個列表的條目內(nèi)容是什么,只需要用戶設(shè)置相關(guān)的寄存器,就可以把相應(yīng)的待識別條目內(nèi)容以字符形式傳遞給識別引擎。

        由此可見,語音識別芯片完成的工作就是:把 MIC(麥克風(fēng))輸入的聲音進(jìn)行頻譜分析后提取語音特征,再和關(guān)鍵詞語列表中的關(guān)鍵詞語進(jìn)行對比匹配,最后找出得分最高的關(guān)鍵詞語作為識別結(jié)果輸出。

        通?;贏SR技術(shù)的語音識別芯片能在兩種情況下給出識別結(jié)果:

        ① 外部送入預(yù)定時間的語音數(shù)據(jù)(比如5s的語音數(shù)據(jù)),芯片對這些語音數(shù)據(jù)運算分析后,給出識別結(jié)果。

        ② 外部送入語音數(shù)據(jù)流,語音識別芯片通過端點檢測(VAD,Voice Activity Detection)技術(shù)檢測出用戶停止說話,把用戶開始說話到停止說話之間的語音數(shù)據(jù)進(jìn)行運算分析后,給出識別結(jié)果。

        對于第一種情況,可以理解為設(shè)定了一個定時錄音(如5s的語音數(shù)據(jù)),芯片在5s后會停止把聲音送入識別引擎,并且根據(jù)已送入引擎的語音數(shù)據(jù)計算出識別結(jié)果。

        對于第二種情況,需要了解VAD的工作原理:VAD技術(shù)是在一段語音數(shù)據(jù)流中,判斷出哪個時間點是人聲音的開始,哪個時間點是人聲音的結(jié)束。判斷的依據(jù)是,在背景聲音的基礎(chǔ)上有了語音發(fā)音,則視為聲音的開始。而后,檢測到一段持續(xù)時間的背景音(比如600ms),則視為人聲說話結(jié)束。通過VAD判斷出人聲說話的區(qū)域后,語音識別芯片會把這期間的聲音數(shù)據(jù)進(jìn)行識別處理,計算出識別結(jié)果。

        除了以上兩種情況外,語音識別算法無法“主動”地判斷出是否識別出了一個結(jié)果。這是因為,在計算過程中的任何時刻,語音識別器都會對已送入識別芯片的聲音數(shù)據(jù)進(jìn)行分析,并根據(jù)匹配程度為識別列表中的關(guān)鍵詞語進(jìn)行打分,最匹配的打分最高。但是,由于識別算法不知道用戶后面是否還繼續(xù)說話,所以無法主動地判斷已經(jīng)識別出的結(jié)果。

        3 語音識別芯片LD3320的工作原理

        3.1 語音識別系統(tǒng)原理結(jié)構(gòu)

        LD3320語音識別芯片采用的就是ASR技術(shù),圖1就是由LD3320和單片機(或嵌入式系統(tǒng))組成的語音識別系統(tǒng)原理框圖。圖中給出了LD3320的內(nèi)部原理結(jié)構(gòu),本文中選用的MCU是STC10L08XE單片機。

        圖1 語音識別系統(tǒng)原理框圖

        語音識別芯片LD3320是ICRoute公司的產(chǎn)品,它采用ASR技術(shù),提供了一種脫離按鍵、鍵盤、鼠標(biāo)、觸摸屏等GUI操作方式且基于語音的用戶界面VUI(Voice User Interface),使得用戶對該系統(tǒng)的操作更簡單、快速和自然。

        用戶只需要把識別的關(guān)鍵詞語以字符串的形式傳送進(jìn)芯片,即可以在下次識別中立即生效。比如,用戶在51等主控MCU的編程中,簡單地通過設(shè)置芯片的寄存器,把諸如“你好”這樣的識別關(guān)鍵詞語的內(nèi)容動態(tài)地傳入芯片中,芯片就可以識別所設(shè)定的關(guān)鍵詞語了。每個關(guān)鍵詞語可以是單字、詞組、短句或者任何的中文發(fā)音的組合?;贚D3320的語音識別系統(tǒng)可以隨著使用流程,在運行時動態(tài)地更改關(guān)鍵詞語列表的內(nèi)容,這樣可以用一個系統(tǒng)支持多種不同的場景,同時也不需要用戶作任何的錄音訓(xùn)練。

        3.2 LD3320的用戶使用模式

        LD3320有兩種用戶使用模式,即“觸發(fā)識別模式”和“循環(huán)識別模式”。用戶可以通過編程,設(shè)置兩種不同的用戶使用模式。

        觸發(fā)識別模式:系統(tǒng)的主控MCU在接收到外界一個觸發(fā)后(比如用戶按動某個按鍵),啟動LD3320芯片的一個定時識別過程(比如5s),要求用戶在這個定時過程中說出要識別的語音關(guān)鍵詞語。這個過程結(jié)束后,需要用戶再次觸發(fā)才能再次啟動一個識別過程。

        循環(huán)識別模式:系統(tǒng)的主控MCU反復(fù)啟動識別過程。如果沒有人說話就沒有識別結(jié)果,則每次識別過程的定時到時后再啟動一個識別過程;如果有識別結(jié)果,則根據(jù)識別作相應(yīng)處理后(比如播放某個聲音作為回答)再啟動一個識別過程。

        4 語音識別系統(tǒng)軟硬件設(shè)計

        4.1 硬件系統(tǒng)設(shè)計

        由圖1可知,由LD3320組成的語音識別系統(tǒng)硬件有單片機(或嵌入式系統(tǒng))及LD33202。圖2和圖3分別是由單片機STC10L08XE構(gòu)成的主控芯片和由LD3320A構(gòu)成的語音識別主系統(tǒng)。

        圖2 STC10L08XE構(gòu)成的主控芯片

        4.2 軟件系統(tǒng)設(shè)計

        圖3 LD3320A構(gòu)成的語音識別主系統(tǒng)

        語音識別的操作順序是:先進(jìn)行語音識別的初始化,然后寫入識別列表,系統(tǒng)即開始進(jìn)行語音識別,并準(zhǔn)備好中斷響應(yīng)函數(shù),打開中斷允許位。這里如果不用中斷方式,也可以通過查詢方式工作。在“開始識別”后,讀取寄存器B2H的值,如果為21H就表示有識別結(jié)果產(chǎn)生。

        下面是語音識別的初始化程序段,按照以下序列來設(shè)置寄存器:

        初始化后是寫入識別列表。識別列表的規(guī)則是:每個識別條目對應(yīng)一個特定的編號(1個字節(jié)),不同識別條目的編號可以相同,而且不用連續(xù)。LD3320芯片最多支持50個識別條目,每個識別條目是標(biāo)準(zhǔn)普通話的漢語拼音(小寫),每2個字(漢語拼音)之間用1個空格間隔。表1是一個簡單的例子。

        表1 識別列表

        圖4是由LD3320組成的語音識別系統(tǒng)主程序流程,圖5是語音識別系統(tǒng)中斷服務(wù)程序流程。

        圖4 語音識別系統(tǒng)主程序流程

        圖5 語音識別系統(tǒng)中斷服務(wù)程序流程

        5 聲控電視遙控器

        聲控電視遙控器最有用的地方是,在更換頻道時可以直接說出頻道名稱,而不是去記憶頻道名稱和頻道數(shù)字的聯(lián)系。同時,在使用電視遙控器時,遙控器是用電池工作,不能讓識別芯片一直處于工作狀態(tài)。因此在設(shè)計時,可以在遙控器上設(shè)置一個大一點的按鍵,用戶在使用時,按一下這個按鍵,啟動LD3320語音識別芯片,此時可以播放一聲“嘀”的提示音,然后在限定的時間內(nèi)(如5s),接收用戶的語音命令,并給出識別結(jié)果。比如用戶說“體育臺”,識別芯片把識別結(jié)果提供給遙控器的主控MCU。隨后遙控器的主控MCU就根據(jù)事先設(shè)定好的對應(yīng)關(guān)系,發(fā)出對應(yīng)頻道的紅外編碼,實現(xiàn)換臺??梢圆患哟_認(rèn)過程直接換臺。圖6為聲控電視遙控器工作流程。

        結(jié) 語

        圖6 聲控電視遙控器工作流程

        這種語音識別系統(tǒng)也容易引起誤識別,如當(dāng)用戶說的內(nèi)容不在識別列表內(nèi)時,必然會引起誤識別。為了克服這些缺點,降低誤識別率,可在設(shè)定好要識別的關(guān)鍵詞語后,再添加一些與識別列表內(nèi)的單詞有聯(lián)系的任意其他詞匯,用來吸收錯誤識別,從而達(dá)到降低誤識別率的目的。

        由LD3320組成的語音識別系統(tǒng)有很廣泛的應(yīng)用,如語音控制的點歌系統(tǒng)、語音控制的手機、音控智能導(dǎo)航儀、音控智能家電產(chǎn)品等。

        [1]LD3320 數(shù)據(jù) 手冊 [EB/OL].(2010-06-08)[2011-09].http://www.icroute.com/index.html.

        [2]肖來勝,馮建蘭,夏術(shù)泉.單片機技術(shù)實用教程 [M].武漢:華中科技大學(xué)出版社,2004.

        [3]宗光華,李大寨.多單片機系統(tǒng)應(yīng)用技術(shù)[M].北京:國防工業(yè)出版社,2003.

        猜你喜歡
        遙控器列表關(guān)鍵
        巧用列表來推理
        高考考好是關(guān)鍵
        學(xué)習(xí)運用列表法
        時間遙控器
        爸媽有個“遙控器”
        擴列吧
        行走的飛行遙控器
        按錯遙控器
        獲勝關(guān)鍵
        NBA特刊(2014年7期)2014-04-29 00:44:03
        不含3-圈的1-平面圖的列表邊染色與列表全染色
        亚洲精品午夜无码专区| 一区二区三区在线观看人妖| 亚洲一区二区三区av色婷婷| 中文字幕av一区二区三区诱惑| 亚洲熟女少妇精品久久| 成人激情视频在线手机观看| 伊人加勒比在线观看视频| 天天做天天爱夜夜夜爽毛片| 夜夜躁狠狠躁日日躁2022| 日日摸天天摸人人看| 亚洲国产高清在线观看视频| 99久久精品国产自在首页| 厕所极品偷拍一区二区三区视频| 国产丝袜美腿在线播放| www国产亚洲精品| 国产精品自在线拍国产| 欧美成人www免费全部网站| 日本嗯啊在线观看| 免费人成网站在线播放 | 国产综合精品久久99之一| 国产激情久久久久影院老熟女免费| 天堂中文资源在线地址| 亚洲全国最大的人成网站| 二区三区日本高清视频| 日本又色又爽又黄的a片18禁| 精品国模一区二区三区| 国产普通话对白视频二区| 中文人妻无码一区二区三区| 日本熟妇精品一区二区三区| 日韩有码在线观看视频| 人妻少妇-嫩草影院| 日日猛噜噜狠狠扒开双腿小说| 97se亚洲国产综合自在线图片| 在线成人tv天堂中文字幕| 亚洲国产av中文字幕| 国产真实一区二区三区| 激情综合丁香五月| 乱码一二三入区口| 粗大挺进尤物人妻一区二区 | 亚洲国产日韩在线人成蜜芽| 街拍丝袜美腿美女一区|