亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用

        2021-11-05 08:03:38李青云
        電子技術(shù)與軟件工程 2021年17期
        關(guān)鍵詞:嵌入式大眾語(yǔ)音

        李青云

        (晉中信息學(xué)院信息工程學(xué)院 山西省晉中市 030800)

        近年以來,國(guó)內(nèi)的社會(huì)經(jīng)濟(jì)實(shí)現(xiàn)了快速的發(fā)展和推進(jìn),其重要表現(xiàn)之一就是計(jì)算機(jī)技術(shù)的飛速發(fā)展,目前計(jì)算機(jī)已經(jīng)成為了現(xiàn)代社會(huì)大眾日常工作和生活中必不可少的一部分,然而人機(jī)交互水平與計(jì)算機(jī)技術(shù)發(fā)展水平不相符合,影響了現(xiàn)代社會(huì)大眾對(duì)于計(jì)算機(jī)系統(tǒng)的應(yīng)用。在這種情況下,就需要實(shí)現(xiàn)高水平的語(yǔ)音識(shí)別算法在嵌入式系統(tǒng)中的應(yīng)用,使得計(jì)嵌入式系統(tǒng)的語(yǔ)音識(shí)別性能得到提升,這樣才能實(shí)現(xiàn)復(fù)雜的語(yǔ)音識(shí)別,嵌入式系統(tǒng)也才能實(shí)現(xiàn)智能化發(fā)展。而且語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用也更加符合現(xiàn)代社會(huì)大眾的使用習(xí)慣和切實(shí)需求,因此語(yǔ)音識(shí)別算法的運(yùn)用是具有充分的可行性和必要性的,對(duì)于各個(gè)社會(huì)領(lǐng)域的發(fā)展也是極為重要的。

        1 語(yǔ)音識(shí)別算法

        在社會(huì)大眾的顯示工作和生活當(dāng)中,語(yǔ)音識(shí)別系統(tǒng)應(yīng)用范圍比較廣,并且這種交互方式是人類自身最自然的一種交互方式,使用起來符合人類自身的習(xí)慣,同時(shí)嵌入式設(shè)備自身的小型化對(duì)于語(yǔ)音識(shí)別算法的應(yīng)用也大有裨益。目前所應(yīng)用的嵌入式設(shè)備通常情況下是針對(duì)特定的應(yīng)用進(jìn)行設(shè)計(jì)的,只需要對(duì)幾十個(gè)詞的語(yǔ)音命令進(jìn)行識(shí)別,屬于小型的語(yǔ)音識(shí)別系統(tǒng),一旦遇到大詞匯量和連續(xù)的語(yǔ)音識(shí)別,其應(yīng)用的局限性就會(huì)變得尤其明顯,難以滿足當(dāng)代社會(huì)大眾對(duì)于嵌入式設(shè)備的要求和需求。而在實(shí)際的語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用過程中,還具有很多其他的因素需要進(jìn)行綜合性的考量,這樣才能達(dá)到理想的語(yǔ)音識(shí)別效果,并且可以在顯示社會(huì)發(fā)展過程中進(jìn)行對(duì)應(yīng)的應(yīng)用[3],其中成本因素就是需要考量的因素之一,因?yàn)槲磥淼恼Z(yǔ)言識(shí)別系統(tǒng)的應(yīng)用將是十分廣泛的,其成本投入過大的情況下,不能形成良好的性價(jià)比。

        其次,嵌入式設(shè)備所具有的一個(gè)最重要的優(yōu)勢(shì)就是自身的體積比較小,這也給語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用帶來比較大的限制。為了使得比較復(fù)雜的算法在嵌入式設(shè)備中進(jìn)行應(yīng)用,其中硬件平臺(tái)是非常重要的,其中SoC 硬件平臺(tái)具有很好的集成性,在這一平臺(tái)上的語(yǔ)音識(shí)別算法應(yīng)用的嵌入式系統(tǒng)的可靠性也得到了比較大的提升,從另一個(gè)角度上來說,語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用,使得嵌入式系統(tǒng)的適應(yīng)性得到了很好的提升。

        語(yǔ)音識(shí)別系統(tǒng)是系統(tǒng)級(jí)的集成芯片,其不僅僅是將功能復(fù)雜的數(shù)字邏輯電路放到同一個(gè)芯片當(dāng)中,芯片中還包含很多其他的電子元件,包含模擬器件和常見的儲(chǔ)存器,這些都是需要進(jìn)行考量的因素。筆者主要針對(duì)基于HMM 的語(yǔ)音識(shí)別技術(shù)在嵌入式系統(tǒng)中的應(yīng)用進(jìn)行系統(tǒng)的分析和闡述,具有良好的發(fā)展前景,并且更加符合現(xiàn)代社會(huì)大眾的嵌入式設(shè)備的使用習(xí)慣和特點(diǎn)。

        2 硬件平臺(tái)的分析

        筆者進(jìn)行研究的嵌入式語(yǔ)音識(shí)別系統(tǒng)是在與Infineon 公司合作開發(fā)的芯片UniSpeech 上實(shí)現(xiàn)的,這一硬件平臺(tái)的性價(jià)比也是比較高的,使得語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用成本方面得到了很好的基礎(chǔ)性的條件。

        通過研究不難發(fā)現(xiàn),該芯片的應(yīng)用,為語(yǔ)音識(shí)別算法提供了良好的儲(chǔ)存量和運(yùn)算能力[4],具體性能方面如下所示:

        運(yùn)算速度:100MIPS.MCU;

        指令周期:每?jī)蓚€(gè)時(shí)鐘周期;

        時(shí)鐘頻率:50MHz。

        3 不同的嵌入式語(yǔ)音識(shí)別系統(tǒng)的比較和分析

        (1)基于DTW(Dynamic Time Warping[5])和模擬匹配技術(shù)的語(yǔ)音識(shí)別系統(tǒng)

        我們?nèi)粘9ぷ骱蜕钸^程中所使用的移動(dòng)電話設(shè)備,幾乎都可以提供簡(jiǎn)單的語(yǔ)音識(shí)別功能。

        其中基于DTW(Dynamic Time Warping)和模擬匹配技術(shù)的組合應(yīng)用能夠取得很好的效果,在實(shí)際的運(yùn)用過程中,這一系統(tǒng)可以直接進(jìn)行語(yǔ)音特征的提取,并且將其視為具體的模板進(jìn)行運(yùn)用,通過這些精準(zhǔn)的模板,在實(shí)際的語(yǔ)音識(shí)別過程中可以實(shí)現(xiàn)很好的識(shí)別效果,尤其是孤立詞的識(shí)別,在實(shí)踐應(yīng)用過程中也能夠發(fā)現(xiàn)這一點(diǎn)。但是需要知曉的是,DTW 模板自身的計(jì)算能力是十分有限的,其重要表現(xiàn)就是實(shí)際應(yīng)用階段限于小詞表,由于這一特點(diǎn),這一嵌入式語(yǔ)音識(shí)別系統(tǒng)的應(yīng)用就具有了一定的局限性,一般情況下都在一些特定的、簡(jiǎn)單的語(yǔ)音識(shí)別工作中進(jìn)行運(yùn)用,包含地名識(shí)別、人名集識(shí)別等等。

        (2)基于隱含馬爾科夫模型HMM(Hidden Markov Model)的語(yǔ)音識(shí)別系統(tǒng)

        基于HMM 的嵌入式語(yǔ)音識(shí)別系統(tǒng)可以在非定人用戶的日常工作和生活中進(jìn)行運(yùn)用,并且不需要進(jìn)行實(shí)現(xiàn)的訓(xùn)練[6],這項(xiàng)技術(shù)的缺陷在于需要建立其一個(gè)比較大、比較豐富的語(yǔ)音庫(kù),從而建立有效的統(tǒng)計(jì)分析模型,提升語(yǔ)音識(shí)別的有效性和可靠性,從中不難看出,基于隱含馬爾科夫模型HMM(Hidden Markov Model)的語(yǔ)音識(shí)別系統(tǒng)具有很好的特性,但是其在很多因素和條件方面具有一定的限制,需要在系統(tǒng)組建過程中多加注意。

        4 基于HMM的嵌入式語(yǔ)音識(shí)別系統(tǒng)構(gòu)建

        4.1 前端處理

        基于HMM 的嵌入式語(yǔ)音識(shí)別系統(tǒng)的前端處理主要包含語(yǔ)音的采樣、A/D 變化、特片提取和端點(diǎn)檢測(cè)等等,其中模擬的語(yǔ)音信號(hào)的數(shù)字化功能是由A/D 轉(zhuǎn)換器來實(shí)現(xiàn)的,ADC 集成在片內(nèi),其采樣頻率固定位8kHz,語(yǔ)音特征的提取是從語(yǔ)音幀的角度來實(shí)現(xiàn)的,具體的HMM 與語(yǔ)音參數(shù)的關(guān)系如圖1所示。

        圖1:HMM 與語(yǔ)音參數(shù)的關(guān)系圖

        因此需要將特定的語(yǔ)音信號(hào)分為重疊的若干幀,隨后對(duì)每一幀提取一次語(yǔ)音特片,幀長(zhǎng)方面控制在20ms 即可,筆者研究分析的此系統(tǒng),為了方便進(jìn)行FFT,采用的幀長(zhǎng)需要控制在256 點(diǎn),也就是32ms,這是出于系統(tǒng)的儲(chǔ)存量限制和識(shí)別性能要求,依據(jù)實(shí)踐也能夠發(fā)現(xiàn),前端處理按照以上進(jìn)行選擇和應(yīng)用,可以保障特征處理的穩(wěn)健性[7],這是其他的嵌入式語(yǔ)音識(shí)別系統(tǒng)所難以實(shí)現(xiàn)的,并且對(duì)其進(jìn)行優(yōu)化和完善之后,可以達(dá)到HMM 模型與多觀察序列語(yǔ)音參數(shù)的關(guān)系實(shí)現(xiàn),其中一個(gè)音素模型的HMM 結(jié)構(gòu)具體如圖2所示。

        圖2:一個(gè)音素模型的HMM 結(jié)構(gòu)

        在實(shí)踐應(yīng)用過程中可以發(fā)現(xiàn),這一處理方式對(duì)于特征處理穩(wěn)健性的提升是相當(dāng)明顯的。

        4.2 聲學(xué)模型

        在本文進(jìn)行研究的HMM 算法為基礎(chǔ)的嵌入式語(yǔ)音識(shí)別系統(tǒng)當(dāng)中,首先對(duì)于一系列有限狀態(tài)S1……SN 進(jìn)行了定義,該系統(tǒng)的狀態(tài)不為外界所見,系統(tǒng)在識(shí)別中使用的隨機(jī)觀察矢量就是從信號(hào)中提取的特征矢量。在本語(yǔ)音識(shí)別系統(tǒng)當(dāng)中,采用的是整詞模型,每個(gè)詞條7 個(gè)狀態(tài)同,包含首尾兩個(gè)靜音狀態(tài)。但是CHMM 模型具有比較高的復(fù)雜性,碼本大小位128,DHMM 模型加大了矢量量化這一步驟,但是使得模型的復(fù)雜程度降低,這使得占用計(jì)算量最大的匹配計(jì)算減少,從中也能夠看出,這其實(shí)是犧牲了一定的識(shí)別性能的[8]。

        4.3 語(yǔ)音識(shí)別性能

        基于HMM 的嵌入式語(yǔ)音識(shí)別系統(tǒng)具有很好的識(shí)別性能,對(duì)于11 詞的漢語(yǔ)數(shù)碼和一個(gè)59 詞的命令詞集,其都能做到很好的識(shí)別,其中靜音模型的加入,降低了對(duì)端點(diǎn)判斷的依賴程度,這對(duì)于HMM 算法為基礎(chǔ)的嵌入式語(yǔ)音識(shí)別系統(tǒng)的可靠性的提升是比較大的,從整體的角度上來說,目前國(guó)內(nèi)的HMM 算法為基礎(chǔ)的嵌入式語(yǔ)音識(shí)別系統(tǒng)模型還是比較少的,而目前主流DSP 都可以提供100MIPS 以上的運(yùn)算速度[9],完全可以滿足CHMM 對(duì)計(jì)算能力的要求,這也從側(cè)面驗(yàn)證,HMM 算法為基礎(chǔ)的嵌入式語(yǔ)音識(shí)別系統(tǒng)的組建和推廣應(yīng)用都具有相當(dāng)高的可行性和必要性,這一系統(tǒng)在五十詞以內(nèi)的詞令識(shí)別上,其效果表現(xiàn)非常不錯(cuò),HMM 算法為基礎(chǔ)的嵌入式語(yǔ)音識(shí)別系統(tǒng)可以在家電、玩具、智能儀器上進(jìn)行廣泛的應(yīng)用,具有良好的發(fā)展前景。

        5 結(jié)論

        綜上所述,就是目前為止針對(duì)語(yǔ)音識(shí)別算法及其在嵌入式系統(tǒng)中的應(yīng)用的相關(guān)研究和分析了,從文中闡述內(nèi)容中不難看出,不同的語(yǔ)音識(shí)別算法為基礎(chǔ)的嵌入式系統(tǒng),其性能、可靠性等方面都具有比較大的不同。其中筆者進(jìn)行研究和分析的HMM 算法為基礎(chǔ)的嵌入式語(yǔ)音識(shí)別系統(tǒng)具有很好的實(shí)踐效果,并且可以在現(xiàn)代社會(huì)大眾的日常工作、生活以及社會(huì)發(fā)展中進(jìn)行運(yùn)用,系統(tǒng)資源的消耗相對(duì)合理,并且具有很好的系統(tǒng)性價(jià)比,值得后續(xù)進(jìn)行推廣運(yùn)用,對(duì)于國(guó)民經(jīng)濟(jì)發(fā)展非常重要。

        猜你喜歡
        嵌入式大眾語(yǔ)音
        一汽-大眾ID.6CROZZ
        汽車觀察(2021年11期)2021-04-24 18:04:58
        上汽大眾ID.3
        汽車觀察(2021年11期)2021-04-24 18:04:58
        魔力語(yǔ)音
        基于MATLAB的語(yǔ)音信號(hào)處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對(duì)方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        搭建基于Qt的嵌入式開發(fā)平臺(tái)
        嵌入式軟PLC在電鍍生產(chǎn)流程控制系統(tǒng)中的應(yīng)用
        Altera加入嵌入式視覺聯(lián)盟
        倍福 CX8091嵌入式控制器
        亚洲一二三四区免费视频| 在线观看视频亚洲| 国产高清天干天天视频| 男女打扑克视频在线看| 日韩人妻熟女中文字幕a美景之屋 国产suv精品一区二区四 | 伊人色综合九久久天天蜜桃| 久久精品亚洲94久久精品| 免费人成在线观看网站| 在线播放亚洲第一字幕| 国产自精品在线| 精品人妻av一区二区三区四区| a级毛片免费观看在线播放| 亚洲欧美日韩国产综合一区二区| 国产成社区在线视频观看| 亚洲国产av综合一区| 国内精品久久久人妻中文字幕| 亚洲av永久无码精品秋霞电影影院 | 无码人妻AⅤ一区 二区 三区| 国产三级三级精品久久| 国精产品一区一区三区| 欧美亚洲日本国产综合在线| 久久精品国产屋| 男女激情视频网站免费在线| 国产伦人人人人人人性| 无码国产亚洲日韩国精品视频一区二区三区 | 成人做爰69片免费看网站| 在线无码免费看黄网站| 亚洲国产精品高清在线| 亚洲毛片αv无线播放一区| 亚洲AⅤ无码国精品中文字慕| 国产风骚主播视频一区二区| 无码熟妇人妻av在线影片最多| 8888四色奇米在线观看| 妇女自拍偷自拍亚洲精品| 国产亚洲自拍日本亚洲| a级毛片无码免费真人| 亚洲中文久久久久无码| 国产一区二区三区日韩在线观看| 正在播放国产多p交换视频| 手机在线精品视频| 亚洲女同性恋激情网站|