亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        語音識(shí)別自適應(yīng)算法在智能家居中的應(yīng)用①

        2017-10-13 14:48:01張林軍
        關(guān)鍵詞:云端智能家居客戶端

        蔣 泰, 張林軍

        ?

        語音識(shí)別自適應(yīng)算法在智能家居中的應(yīng)用①

        蔣 泰, 張林軍

        (桂林電子科技大學(xué)計(jì)算機(jī)與信息安全學(xué)院, 桂林541004)

        在基于語音識(shí)別的智能家居中, 用于訓(xùn)練的語料庫不完備且應(yīng)用場(chǎng)景復(fù)雜, 自然語言語音識(shí)別錯(cuò)誤接受率遠(yuǎn)遠(yuǎn)高于小詞匯的語音識(shí)別的錯(cuò)誤接受率. 作者在設(shè)計(jì)與實(shí)現(xiàn)基于自然語言的語音識(shí)別智能家居系統(tǒng)的過程中, 深入研究了MAP、MLLR算法在基于HMM聲學(xué)模型參數(shù)中的作用, 提出了一種綜合的自適應(yīng)方法, 并基于開源的語音識(shí)別工具CMU SPHIN最終完整的實(shí)現(xiàn)了該系統(tǒng), 結(jié)果表明所提出的自適應(yīng)新算法可行有效, 較好改善了系統(tǒng)在不同場(chǎng)景中的性能.

        語音識(shí)別; 自適應(yīng); MAP; MLLR; 智能家居; 開源工具

        現(xiàn)代社會(huì)已經(jīng)進(jìn)入了高科技迅猛發(fā)展的信息時(shí)代, 隨著信息技術(shù)的飛速發(fā)展, 以及人們生活水平的提高, 智能家居開始走進(jìn)普通家庭. 大眾接受智能家居的概念的同時(shí)也對(duì)智能家居提出了更高的要求. 加上國(guó)家政府大力推進(jìn)城鎮(zhèn)化建設(shè), 一些地產(chǎn)開發(fā)商需要更高標(biāo)準(zhǔn)的高智能家居設(shè)備和智慧社區(qū)方案來提高其產(chǎn)品的附加值以便提高其地產(chǎn)產(chǎn)品的競(jìng)爭(zhēng)力. 如今, 家居的語音智能化控制已成為計(jì)算機(jī)、通信等行業(yè)競(jìng)相研究的熱點(diǎn)[1].

        訓(xùn)練環(huán)境與識(shí)別環(huán)境存在大量差異是造成語音識(shí)別系統(tǒng)性能下降的主要原因之一. 說話人、環(huán)境和信道特征等不同所引起的語音信號(hào)的多變性、差異性, 一直是人們關(guān)注的重點(diǎn)和難點(diǎn)[2]. 如何使語音識(shí)別系統(tǒng)克服這種差異, 通過少量數(shù)據(jù)得到較高的性能十分重要. 自適應(yīng)技術(shù)可以解決這個(gè)問題, 其主要研究的內(nèi)容是通過對(duì)系統(tǒng)參數(shù)進(jìn)行調(diào)整, 使系統(tǒng)更好地適應(yīng)由麥克風(fēng)、傳輸信道、環(huán)境噪音、說話人、文體和應(yīng)用的上下文等引起的差異. 而基于模型層的自適應(yīng)算法能充分利用有限的自適應(yīng)數(shù)據(jù)通過對(duì)模型參數(shù)進(jìn)行調(diào)整, 逐漸將模型參數(shù)變換到實(shí)際環(huán)境, 從而來提高語音識(shí)別系統(tǒng)的性能.

        最大后驗(yàn)概率(Maximum A Posteriori, MAP)算法和最大似然線性回歸(Maximum Likelyhood Linear Regression, MLLR)算法是基于模型層說話人自適應(yīng)中的基本算法[3]. MAP有很好的漸進(jìn)性,可以充分利用語音數(shù)據(jù)的細(xì)節(jié)信息. 它通過理論給出了結(jié)合先驗(yàn)知識(shí)和自適應(yīng)數(shù)據(jù)的最優(yōu)解. 基于MAP的自適應(yīng)方法認(rèn)為模型參數(shù)是符合某種先驗(yàn)分布的隨機(jī)變量, 將先驗(yàn)知識(shí)和從自適應(yīng)數(shù)據(jù)中得到的知識(shí)結(jié)合起來估計(jì)模型參數(shù), 避免了自適應(yīng)數(shù)據(jù)估計(jì)的錯(cuò)誤. 該方法有很好的漸進(jìn)性, 當(dāng)自適應(yīng)數(shù)據(jù)不斷增加時(shí), 自適應(yīng)效果將穩(wěn)步提高. 但是算法收斂速度慢, 只能對(duì)有觀測(cè)數(shù)據(jù)的模型自適應(yīng), 無法處理沒有觀測(cè)值的模型. MLLR方法是通過一些線性變換來對(duì)初始模型進(jìn)行自適應(yīng)的. 這種方法的優(yōu)點(diǎn)是比較簡(jiǎn)單,而且自適應(yīng)速度比較快. 即使自適應(yīng)數(shù)據(jù)量不足, 方法也可以獲得較理想的效果. 由于自由參數(shù)少, 很難對(duì)每個(gè)模型精細(xì)描述, 而且比較難以引入先驗(yàn)知識(shí). 針對(duì)以隱馬爾可夫模型作為建?;A(chǔ)的聲學(xué)模型, 本文研究以相對(duì)較少自適應(yīng)數(shù)據(jù)的情況下獲得較好性能的自適應(yīng)方法. 為了提高語音識(shí)別的性能, 一般語音識(shí)別系統(tǒng)都綜合使用幾種自適應(yīng)技術(shù). 本文提出了一種綜合漸進(jìn)自適應(yīng)方法, 通過在漸進(jìn)的 MAP算法中引入了一個(gè)簡(jiǎn)化的MLLR模塊, 用來處理語音識(shí)別中訓(xùn)練數(shù)據(jù)與實(shí)際應(yīng)用場(chǎng)景不同的差異, 并且使用CMU SPHINX開源工具使其運(yùn)用到智能家居領(lǐng)域, 最終使用較少的自適應(yīng)數(shù)據(jù)取得了較好的應(yīng)用效果.

        1 語音識(shí)別的智能家居框架

        本系統(tǒng)由軟件和硬件兩部分組成, 如圖1所示. 軟件部分又分為云端和嵌入式客戶端. 云端和客戶端各自集成了幾個(gè)主要模塊, 分別實(shí)現(xiàn)不同的功能.

        圖1 系統(tǒng)架構(gòu)模型

        云端軟件運(yùn)行在Linux上, 它包含聲學(xué)模型、語音模型、語料庫、CMU Sphinx工具包、Java虛擬機(jī). 云端主要功能是接受客戶端發(fā)送的語音文件轉(zhuǎn)化成文本文件返回, 應(yīng)用程序模塊全部使用Java開發(fā), 調(diào)用CMU Sphinx提供的類庫. 主要功能包含語音識(shí)別算法和語義轉(zhuǎn)換模塊, 它被部署在Java虛擬機(jī)上. 語音識(shí)別算法的主要過程有: 語音輸入、預(yù)處理、特征提取、模型匹配、輸出結(jié)果. 首先必須使用CMU Sphinx的訓(xùn)練工具以特定聲學(xué)模型為基礎(chǔ)對(duì)語料庫獲取匹配的MFCC特征數(shù)據(jù), 然后使用MAP和MLLR自適應(yīng)技術(shù)來改進(jìn)原來的聲學(xué)模型. 本文主要討論以HMM為基礎(chǔ)的聲學(xué)模型使用MAP、MLLR對(duì)其參數(shù)進(jìn)行自適應(yīng).

        嵌入式客戶端軟件包含語音識(shí)別模塊和嵌入式硬件驅(qū)動(dòng)模塊. 語音識(shí)別模塊功能包含三個(gè)方面: 獲取客戶語音并生產(chǎn)語音文件、發(fā)送語音文件到云端并接受返回的硬件原語文件、通過硬件原語文件來驅(qū)動(dòng)外圍電路. 驅(qū)動(dòng)模塊主要是控制外圍設(shè)備并對(duì)語音模塊提供服務(wù)支持.

        2 最大后驗(yàn)概率(MAP)

        基于MAP的自適應(yīng)方法是基于最大后驗(yàn)準(zhǔn)則并通過引入先驗(yàn)知識(shí)來求最大后驗(yàn)概率[4], 進(jìn)而提高自適應(yīng)效果, 它與最大似然重估方法相對(duì)應(yīng)叫做最大后驗(yàn)概率重估方法[5]. 假設(shè)O ={1,2, …,r}是概率密度函數(shù)為() 的一系列觀察值, 是定義分布的參數(shù)集合. MAP可以看作是給定訓(xùn)練數(shù)據(jù)序列, 估算的過程, 如下:

        λs=argmax p(λ|O) (1)

        利用貝葉斯準(zhǔn)則(Bayes Rule), 其中(λ) 是HMM參數(shù)的先驗(yàn)分布, 引入符合先驗(yàn)分布(λ)的隨機(jī)變量, 可以得到:

        λ=argmax()argmax()() (2)

        需要強(qiáng)調(diào)的是先驗(yàn)知識(shí)是MAP成功的關(guān)鍵. 對(duì)于具有高斯混合密度的CDHMM, 所有參數(shù)的先驗(yàn)知識(shí)中, 由于在CDHMM參數(shù)中均值向量對(duì)識(shí)別結(jié)果的影響最大, 因此MAP一般只對(duì)均值重估.

        假設(shè)觀察值χ1, χ2, …, χ3的均值未知, 且服從方差為2的高斯分布, 同時(shí)假定的共軛先驗(yàn)分布與同分布, 且均值為, 方差是2. 經(jīng)計(jì)算可得:

        把式(3)經(jīng)過符號(hào)替換后可以得到MAP均值重估公式, 即:

        從式(4)可以看出,k與自適應(yīng)數(shù)據(jù)成正比, 即MAP重估與自適應(yīng)數(shù)據(jù)成正比且隨著自適應(yīng)數(shù)據(jù)的增加而逐漸逼近最大似然估計(jì)(Maximum Likelihood, ML), 當(dāng)自適應(yīng)數(shù)據(jù)趨于無窮時(shí), 用MAP 法所得的模型與用充分語料做ML訓(xùn)練所得的模型基本相同[6]. 對(duì)于式(4)轉(zhuǎn)換改寫如下:

        3 最大似然線性回歸(MLLR)

        當(dāng)HMM用在聲學(xué)建模時(shí), 對(duì)較重要的參數(shù)進(jìn)行自適應(yīng), 一般使用均值向量和協(xié)方差矩陣. 最大似然回歸(Maximum Likelyhood Linear Regression, MLLR)方法是使用最大似然(Maximum Likelyhood, ML)重估算法對(duì)自適應(yīng)數(shù)據(jù)估算出一套轉(zhuǎn)移參數(shù), 用轉(zhuǎn)移參數(shù)把SI系統(tǒng)參數(shù)轉(zhuǎn)換成自適應(yīng)模型參數(shù)[7], 即

        對(duì)于式(6)進(jìn)行變換參數(shù)的估計(jì), 應(yīng)用到重新估計(jì)CDHMM模型的新均值, 可以用下面的公式表示:

        其中為()維矩陣,ц,ц,…,ц是變換前的均值向量,為變換的偏移量,為自適應(yīng)后的向量.

        采用單一的MLLR轉(zhuǎn)換方法效果有限, 在采用多回歸類的情況下, 目標(biāo)就是得到回歸類中所有元素共享的轉(zhuǎn)移矩s. 應(yīng)用自適應(yīng)數(shù)據(jù)的最大似然估計(jì), 通過定義和全矩陣同樣的輔助函數(shù), 經(jīng)推導(dǎo)可得:

        其中矩陣D是這樣定義的[8]:

        現(xiàn)在定義兩個(gè)矩陣(2n×n)和(2n×1)和非零向量ωs:

        ωs=[ω1,1,ωn,1,...,ω2,1,..,ωn,n+1]T(12)

        可以得到

        4 MAP與MLLR綜合的自適應(yīng)技術(shù)

        一般而言, MLLR自適應(yīng)的速度較MAP而言要快, 尤其表現(xiàn)在自適應(yīng)數(shù)據(jù)較少時(shí), 但隨著數(shù)據(jù)增加, MAP的優(yōu)勢(shì)會(huì)逐步突顯出來, 而MLLR在自適應(yīng)數(shù)據(jù)達(dá)到一定數(shù)量時(shí), 算法將趨于飽和. 本文在研究了二者的優(yōu)缺點(diǎn)后, 提出了一種新的自適應(yīng)方法, 即由簡(jiǎn)化的自適應(yīng)模塊MLLR和漸進(jìn)的MAP自適應(yīng)模塊組合而成[9]. 如圖2所示.

        對(duì)于簡(jiǎn)化的MLLR 自適應(yīng)模塊, 主要使用當(dāng)前的語句, 因?yàn)镸LLR 方法中所有模型只使用了一個(gè)回歸類, 換句話說所有的模型的自適應(yīng)數(shù)據(jù)都用來重估同一轉(zhuǎn)移矩陣, 這樣一來當(dāng)前語句就可以滿足自適應(yīng)的要求. 對(duì)于MAP模塊, 它的主要目的是消除音素層的差異. 為了能夠?qū)γ總€(gè)音素的細(xì)微特點(diǎn)進(jìn)行自適應(yīng), 同時(shí)考慮到其方法對(duì)自適應(yīng)數(shù)據(jù)量需要比較大的特點(diǎn), 在MAP 模塊中使用所有累計(jì)的自適應(yīng)數(shù)據(jù). 由于MAP 的自適應(yīng)是在MLLR 的結(jié)果上進(jìn)行, 為了解決計(jì)算所有樣本的參數(shù)計(jì)算量太大的問題, 在計(jì)算時(shí), 必須充分利用上一次計(jì)算的一些中間值. 另外, 通過測(cè)試結(jié)果發(fā)現(xiàn), 本文所提出的組合方法在經(jīng)過很少幾次的組合漸進(jìn)自適應(yīng)后就有很好的自適應(yīng)效果, 不必計(jì)算所有累計(jì)的樣本, 只需要計(jì)算最近的幾次的累計(jì)數(shù)據(jù). 綜合的自適應(yīng)策略如圖3所示.

        圖2 自適應(yīng)模塊

        圖3 自適應(yīng)策略

        5 系統(tǒng)的實(shí)現(xiàn)

        5.1 系統(tǒng)總體流程

        系統(tǒng)分為嵌入式客戶端和云端, 如圖4所示.

        5.2 嵌入式客戶端的實(shí)現(xiàn)

        客戶端為ARM Cortex-A9架構(gòu)處理器, 客戶端系統(tǒng)軟件用Android開發(fā), 使用Android可以充分利用其框架進(jìn)行藍(lán)牙、紅外、ZigBee擴(kuò)展. 為了保證程序隨系統(tǒng)自動(dòng)啟動(dòng), 必須包含一個(gè)擴(kuò)展BroadcastReceiver組件的類用以捕獲ACTION_BOOT_COMPLETED這條廣播, 并在捕獲之后使用startService啟動(dòng)程序的Service, 這樣可以使程序以常駐內(nèi)存的服務(wù)一樣后臺(tái)運(yùn)行. 當(dāng)用戶觸發(fā)語音指令請(qǐng)求后, 程序調(diào)用組件MediaRecorder對(duì)象從MIC獲取聲源并轉(zhuǎn)換成wav文件, 然后通過TCP傳送wav文件給云端, 最后接受云端返回的JSON數(shù)據(jù), 根據(jù)JSON數(shù)據(jù)結(jié)果操作設(shè)備或者傳感器.

        圖4 系統(tǒng)流程圖

        5.3 云端

        云端服務(wù)器操作系統(tǒng)為L(zhǎng)inux, 語音識(shí)別核心主要使用Java開發(fā), 使用MUC SPHINX開源工具加載聲學(xué)、語音學(xué)模型和數(shù)據(jù)字典進(jìn)行語音識(shí)別任務(wù). 程序運(yùn)行在Java VM上, 在指定范圍端口等待服務(wù), 當(dāng)接收到wav文件, 程序會(huì)調(diào)用MUC SPHINX加載相應(yīng)模型數(shù)據(jù)進(jìn)行語音解碼, 把結(jié)果傳遞給語義模塊進(jìn)行分析最終產(chǎn)生硬件原語以JSON的格式返回給客戶端. 在現(xiàn)實(shí)應(yīng)用中不可能收集所有情形下的語音數(shù)據(jù), 并且場(chǎng)景數(shù)據(jù)越多識(shí)別系統(tǒng)越分散, 任一個(gè)具體場(chǎng)景下的識(shí)別工作不可能和預(yù)期非常匹配, 自適應(yīng)技術(shù)在本系統(tǒng)中使用非常必要. 現(xiàn)重點(diǎn)對(duì)現(xiàn)有聲學(xué)模型進(jìn)行自適應(yīng)的改進(jìn)進(jìn)行說明.

        (1) 創(chuàng)建語料庫包含兩個(gè)文件: arctic20.fileids、arctic20.transcription, 文件arctic20.fileids包含語音文件路徑, arctic20.transcription內(nèi)容為文本句子對(duì)應(yīng)的語音文件.

        (2) 為適應(yīng)語料庫里面的每一個(gè)句子錄制一個(gè)語音文件, 錄音文件的內(nèi)容和命名必須同arctic20.transcription里的表示一致, 音頻文件采樣率為16KHz的16bit單聲道的wav格式.

        (3) 從錄制的wav語音文件提取MFCC特征存儲(chǔ)在feat.params文件中, 使用SphinxTrain訓(xùn)練工具自帶的bw程序累加feat.params文件中的統(tǒng)計(jì)數(shù)據(jù).

        (4) 執(zhí)行命令行mllr_solve通過MFCC特征文件和聲學(xué)模型進(jìn)行MLLR變換產(chǎn)生適應(yīng)數(shù)據(jù)文件mllr_matrix.

        (5) 執(zhí)行命令行map_adapt 使用自適應(yīng)數(shù)據(jù)更新模型參數(shù).

        云端主要代碼如下:

        Configuration conf = new Configuration();//加載配置文件

        String sModelDirection="resource:/edu/cmu/sphinx/models/Mandarin";

        String sWavDirection="/com/ht/";

        conf.setAcousticModelPath(sModelDirection);

        conf.setAcousticModelPath("file:zh");

        conf.setDictionaryPath(sModelDirection+"/cmudict-en-us.dict");

        configuration.setLanguageModelPath(sModelDirection+"/en-us.lm.bin");

        StreamSpeechRecognizer recognizer = new StreamSpeechRecognizer(conf);

        while(true){

        if (lsWavFile.size()>0)//接受到wav文件, 啟動(dòng)解碼

        { InputStream stream=HtRecognizer.class.

        getResourceAsStream(sWavDirection+lsWavFile.get(0));

        String sWords="";

        recognizer.startRecognition(stream);

        SpeechResult result;

        while ((result = recognizer.getResult()) != null) {

        for (WordResult r : result.getWords()) sWords+=r;

        if (sWords.length>0)//成功解碼, 返回客戶端 sendData(sWavDirection+lsWavFile.get(0),sWords);

        lsWavFile.remove(0); }

        }

        recognizer.stopRecognition();

        6 語音識(shí)別模塊的實(shí)驗(yàn)和仿真

        為了驗(yàn)證自適應(yīng)技術(shù)的有效性, 實(shí)驗(yàn)使用自建語音數(shù)據(jù)庫. 該數(shù)據(jù)庫包含普通話語音以及少量的英文數(shù)字語音, 共4個(gè)說話人(女2個(gè), 男2個(gè)), 且每個(gè)說話人包含810句錄音, 說話人年齡在25-35歲之間, 分別來自我國(guó)北方、中部和南方地區(qū), 其中都帶有輕微的地方口音. 每人選取720句作為訓(xùn)練語句, 剩下的190句為測(cè)試語句. 810句錄音內(nèi)容由指定的150句常用的智慧家用語, 其余的從報(bào)紙和字典摘取360句和從網(wǎng)絡(luò)新聞中抽取的400句組成.

        圖5 自適應(yīng)模型

        實(shí)驗(yàn)結(jié)果如表1所示, “SI”列為初始的非特定人系統(tǒng)的性能, “SD”列為訓(xùn)練語音庫所對(duì)應(yīng)的特定人語音識(shí)別字錯(cuò)誤率, “綜合”列為系統(tǒng)使用MLLR和MAP自適應(yīng)技術(shù)后非特定的系統(tǒng)性能,1,2,3,4表示四個(gè)說話人.

        表1 綜合實(shí)驗(yàn)結(jié)果

        不同的語音識(shí)別系統(tǒng)針對(duì)的應(yīng)用場(chǎng)景不同, 所用的字典和語料庫也不同, 所關(guān)注的性能評(píng)測(cè)指標(biāo)也有所取舍. 本文關(guān)心的是系統(tǒng)最終的文字識(shí)別率, 假設(shè)總文本字?jǐn)?shù)為, 不正確的識(shí)別字?jǐn)?shù)、沒識(shí)別出的字?jǐn)?shù)、錯(cuò)誤識(shí)別的字?jǐn)?shù), 則有字錯(cuò)誤率公式:

        從結(jié)果中可以清楚的看到, 使用綜合的自適應(yīng)后的模型比SI模型字錯(cuò)誤率有了很大的降低, 測(cè)試集降低了12.7%. 此外, 雖然MAP 和MLLR 有自身優(yōu)點(diǎn)和缺點(diǎn), 但是也有一定的互補(bǔ)性. 實(shí)驗(yàn)過程表明: MAP和 MLLR自適應(yīng)技術(shù)跟憑此使用的先后順序沒有關(guān)系, 綜合自適應(yīng)技術(shù)對(duì)于提升系統(tǒng)性能都有較好體現(xiàn).

        表2 自適應(yīng)實(shí)驗(yàn)結(jié)果

        如表2所示,表示男性,表示女性, 10句和15句表示從相應(yīng)庫中隨機(jī)取10句, 15句. 隨著自適應(yīng)數(shù)據(jù)的增加, MAP自適應(yīng)效果較明顯, 不過在15句以后這種改善就不是很明顯了, 綜合的自適應(yīng)方法不論是在自適應(yīng)數(shù)據(jù)比較少的時(shí)候, 還是處在有噪聲的環(huán)境下都比原有的SI效果要好, 這說明在MLLR方法中引入MAP 方法對(duì)處理說話人差異和環(huán)境差異的系統(tǒng)中都取得了較好的效果.

        7 總結(jié)

        本文設(shè)計(jì)并實(shí)現(xiàn)的基于自然語音的智能家居系統(tǒng)與傳統(tǒng)的語音識(shí)別的智能家居系統(tǒng)在語音識(shí)別技術(shù)方面有著較大的區(qū)別, 對(duì)系統(tǒng)在語音識(shí)別方面有較好的提升, 適合強(qiáng)健語音識(shí)別系統(tǒng)的要求.

        1陳哲.智能家居語音控制系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[碩士學(xué)位論文].成都:電子科技大學(xué),2013.

        2李虎生,劉加,劉潤(rùn)生.語音識(shí)別說話人自適應(yīng)研究現(xiàn)狀及發(fā)展趨勢(shì)電子學(xué)報(bào).電子學(xué)報(bào),2003,31(1).

        3 齊耀輝,潘復(fù)平,葛鳳培,顏永紅.鑒別性最大后驗(yàn)概率聲學(xué)模型自適應(yīng).計(jì)算機(jī)應(yīng)用,2014,34(1):265–269.

        4 詹新明.基于神經(jīng)網(wǎng)絡(luò)的語音識(shí)別研究[碩士學(xué)位論文].廣州:華南理工大學(xué),2013.

        5 Atal BS. Automatic recognition of speakers from their voices. Proc. IEEE. 1976, 64(4): 460–475

        6王治鋒.基于多核融合和模型參數(shù)適應(yīng)的非特定人語音情感識(shí)別研究[碩士學(xué)位論文].蘇州:江蘇大學(xué),2012.

        7 Imamura A. Speaker-adaptive HMM-based speech recognition with a stochastic speaker classifier. Proc. IEEE Int. Conf. Acoustic, Speech, Signal Processing. 1991. 841–844.

        8 榮薇,等.基于改進(jìn)LPCC和MFCC的漢語耳語音識(shí)別.計(jì)算機(jī)工程與應(yīng)用,2007,43(30):213–216.

        9 Digalakis VV, Neumeyer LG. Speaker adaption using combined transformation and Bayesian methods. IEEE Trans. on Speech and Audio Processing, 1996, 4(4): 294–300.

        Speech Recognition Adaptive Algorithm in the Application of the Smart Home

        JIANG Tai, ZHANG Lin-Jun

        (School of Computer and Information Security, Guilin University of Electronic Technology, Guilin 541004, China)

        In smart home based on speech recognition, the corpus used for training is not complete and the application scenario is complex. Besides, the false acceptance rate of natural language speech recognition is much higher than that of small vocabulary speech recognition. During the procedure of designing and trying to implement smart home system based on natural language speech recognition, the author makes an intensive study of the MAP, MLLR algorithm based on the role of HMM acoustic model parameters. This paper presents a comprehensive adaptive method, based on which the author completed the system by using open source tools CMU SPHIN. The experiment result shows that the presented new adaptive algorithm is feasible and effective, and makes the system performance better in different scenarios.

        speech recognition; adaption; MAP; MLLR; smart home; open-source tools

        2014年國(guó)家物聯(lián)網(wǎng)發(fā)展專項(xiàng)資金項(xiàng)目(工信部科函[2014]351號(hào))

        2016-05-17;

        2016-06-27

        [10.15888/j.cnki.csa.005591]

        猜你喜歡
        云端智能家居客戶端
        云端之城
        縣級(jí)臺(tái)在突發(fā)事件報(bào)道中如何應(yīng)用手機(jī)客戶端
        孵化垂直頻道:新聞客戶端新策略
        基于Vanconnect的智能家居瘦客戶端的設(shè)計(jì)與實(shí)現(xiàn)
        基于Zigbee的無線通信技術(shù)在智能家居中的應(yīng)用
        電子制作(2018年1期)2018-04-04 01:48:28
        美人如畫隔云端
        行走在云端
        初中生(2017年3期)2017-02-21 09:17:43
        云端創(chuàng)意
        關(guān)于智能家居真正需求的探討
        智能家居更貼心
        在线观看av中文字幕不卡| 日本乱熟人妻中文字幕乱码69| 亚洲国产一区一区毛片a| 美女丝袜美腿玉足视频| 色综合久久久久综合体桃花网| 女人脱了内裤趴开腿让男躁| 国产av无码专区亚洲av极速版| 又爽又黄禁片视频1000免费| 亚洲五月激情综合图片区| 在线观看极品裸体淫片av| 白色白在线观看免费2| 亚洲av日韩一区二区| 成人午夜福利视频| 高潮毛片无遮挡高清免费| 日韩欧美亚洲中字幕在线播放| 国产美女精品AⅤ在线老女人| 91亚洲色图在线观看| 国产二区中文字幕在线观看| 日本av一区二区三区视频| 精品欧洲av无码一区二区14| 亚洲av无码一区二区三区四区| 免费在线亚洲视频| 国产成人自拍视频在线观看网站| 亚洲熟妇av一区二区在线观看| 婷婷四虎东京热无码群交双飞视频 | 久久精品国产一区二区涩涩| 久久精品国产亚洲av试看| 91色综合久久熟女系列| www夜插内射视频网站| 亚洲av无码一区二区乱孑伦as| 国产午夜福利短视频| 人妻人妻少妇在线系列| 丰满少妇又爽又紧又丰满动态视频| 免费看黄片的视频在线观看| 精品视频一区二区三区在线观看| 亚洲av之男人的天堂网站| 亚洲夜夜骑| 色综合久久五十路人妻| 精品人妻一区三区蜜桃| 97精品超碰一区二区三区| 婷婷开心深爱五月天播播|