亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

淺析改進(jìn)智能語音控制系統(tǒng)的方法

2018-03-21 00:47:15劉明輝

數(shù)字通信世界 2018年5期

劉明輝，徐莉

（天津三星通信技術(shù)研究有限公司，天津 300385）

傳統(tǒng)的人機(jī)交互是通過觸覺來實(shí)現(xiàn)對(duì)機(jī)器的操作和控制，但是這種操作方式有很大的弊端。操作不方便，費(fèi)時(shí)，尤其是針對(duì)視覺障礙的人士來說更加困難。隨著社會(huì)節(jié)奏的不斷加快，人們希望使用一種更加便捷的方式來替代觸覺對(duì)機(jī)器的操控。在這種大背景下智能語音系統(tǒng)的出現(xiàn)體現(xiàn)了其優(yōu)勢(shì)，越來越多的智能設(shè)備采用了這種智能語音的技術(shù)來實(shí)現(xiàn)操控。智能語音控制系統(tǒng)大體分為兩個(gè)部分：語音合成系統(tǒng)和語音識(shí)別系統(tǒng)。

1 語音控制系統(tǒng)介紹

1.1 語音合成系統(tǒng)介紹

語音合成（Text To Speech）是通過機(jī)械的、電子的方法產(chǎn)生人造語音的技術(shù)。傳統(tǒng)工業(yè)領(lǐng)域使用的語音控制方式是通過可編程控制器plc控制數(shù)碼語音芯片，從而實(shí)現(xiàn)語音的分段錄音，組合回放。通過軟件的修改實(shí)現(xiàn)長(zhǎng)段錄音，循環(huán)播放等功能，從而實(shí)現(xiàn)在工業(yè)控制方面的語音合成與解析。這種語音系統(tǒng)，廣泛應(yīng)用于電腦語音中，語音型數(shù)字萬用表，排隊(duì)機(jī)，以及公共汽車報(bào)站等領(lǐng)域[1]。

傳統(tǒng)的語音合成系統(tǒng)，存儲(chǔ)空間較小，其合成詞語受限，只能合成有限的詞語句子，應(yīng)用的場(chǎng)景非常有限；其次，由于語音控制芯片參差不齊，其語音合成效率不高，合成效果差。除此之外，還需要通過算法來優(yōu)化語音合成效果。改進(jìn)的以服務(wù)器為核心的語音合成系統(tǒng)，由于其擁有存儲(chǔ)容量大，可實(shí)現(xiàn)cpu多核處理和處理速度快等優(yōu)勢(shì)，可直接錄制真人語音樣本用于語音播放，不需要算法合成，效率高，質(zhì)量好。并且可以根據(jù)用途，提前錄制語音反饋樣本，極大的擴(kuò)展了語音控制系統(tǒng)的應(yīng)用范圍。

1.2 語音識(shí)別系統(tǒng)介紹

語音識(shí)別，也被稱為自動(dòng)語音識(shí)別（Automatic Speech Recognition，ASR）技術(shù)，就是讓機(jī)器通過識(shí)別和理解過程把語音信號(hào)轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)，也就是讓機(jī)器聽懂人類的語音。由于語音信號(hào)的多樣性和復(fù)雜性，傳統(tǒng)的語音識(shí)別系統(tǒng)只能在一定的限制條件下獲得滿意的性能，或者說只能應(yīng)用于某些特定的場(chǎng)合[2]。比如目前的語音識(shí)別系統(tǒng)，僅對(duì)單一指令識(shí)別效果較好，對(duì)一條語音中包含兩條以上指令的語句，系統(tǒng)無法準(zhǔn)確解析并執(zhí)行用戶指令。改進(jìn)的以服務(wù)器為核心的語音識(shí)別系統(tǒng)，可以對(duì)復(fù)雜的語音指令識(shí)別，通過RU標(biāo)準(zhǔn)語句，和RSU標(biāo)準(zhǔn)生成子語句，分別對(duì)系統(tǒng)進(jìn)行訓(xùn)練，簡(jiǎn)單來說，RU語句就是非常準(zhǔn)確的標(biāo)準(zhǔn)的精簡(jiǎn)的語句指令，要求用戶精準(zhǔn)發(fā)出指令，這種指令由于覆蓋精準(zhǔn)，語料集小，所以處理速度快，效率高，但是對(duì)用戶發(fā)出指令的要求高，而RSU則是研究人員根據(jù)RU指令，對(duì)標(biāo)準(zhǔn)語句進(jìn)行擴(kuò)展，使服務(wù)器能夠解析口語化的指令，由于語料集的擴(kuò)大，從而更能提高理解用戶指令的質(zhì)量。通過這兩種方法對(duì)模型進(jìn)行訓(xùn)練，可以既保證識(shí)別速度，又可以對(duì)口語化的指令進(jìn)行精準(zhǔn)識(shí)別，達(dá)到正確識(shí)別用戶語義的效果。

2 改進(jìn)的語音控制系統(tǒng)

2.1 系統(tǒng)組成

該系統(tǒng)由終端設(shè)備模塊，語音分析模塊，服務(wù)器以及服務(wù)器數(shù)據(jù)庫(kù)組成。用戶通過手持設(shè)備和終端進(jìn)行語音輸入。手持設(shè)備和終端對(duì)用戶輸入的語音進(jìn)行信號(hào)轉(zhuǎn)換然后將解析的語音信號(hào)發(fā)送給服務(wù)器，服務(wù)器內(nèi)預(yù)置了提前訓(xùn)練的匹配規(guī)則，這種匹配規(guī)則是研究人員通過大量的市場(chǎng)調(diào)查制定的規(guī)則，然后接收到的語音信號(hào)與預(yù)先預(yù)制規(guī)則進(jìn)行匹配，當(dāng)匹配準(zhǔn)確度達(dá)到預(yù)先設(shè)定的一個(gè)閾值時(shí)。服務(wù)器即把此規(guī)則認(rèn)為成用戶發(fā)送的指令。然后在服務(wù)器中的數(shù)據(jù)庫(kù)找到相應(yīng)規(guī)則的實(shí)現(xiàn)指令。然后將這個(gè)實(shí)現(xiàn)指令逐條的發(fā)送給手持設(shè)備終端。手持設(shè)備終端根據(jù)發(fā)送的指令進(jìn)行執(zhí)行。執(zhí)行完后，再將結(jié)果反饋給服務(wù)器，服務(wù)器根據(jù)反饋結(jié)果下發(fā)第二條指令或終止指令。

2.2 系統(tǒng)實(shí)現(xiàn)過程

終端設(shè)備可以是手機(jī)，筆記本電腦和其他手持終端設(shè)備。用戶可以通過此終端設(shè)備進(jìn)行語音控制。同時(shí)根據(jù)數(shù)據(jù)庫(kù)下發(fā)的指令。實(shí)現(xiàn)用戶語音控制的目的。

語音分析模塊，此模塊的功能主要是把輸入的語音分解成一定的語音規(guī)則。此規(guī)則，我們根據(jù)詞語的重要程度進(jìn)行劃分。增大有意義的實(shí)詞的比例，刪除沒有意義的虛詞。然后將解析好的語句上傳給服務(wù)器。

服務(wù)器端，提前根據(jù)研究員制訂的一系列常用的匹配規(guī)則進(jìn)行訓(xùn)練。而數(shù)據(jù)庫(kù)中存放的是這些規(guī)則對(duì)應(yīng)的執(zhí)行指令。一條規(guī)則會(huì)對(duì)應(yīng)多條執(zhí)行指令來完成這個(gè)功能。服務(wù)器接收到語音分析模塊上傳的語音。解析的結(jié)果和服務(wù)器中的規(guī)則進(jìn)行匹配。當(dāng)匹配到某一個(gè)規(guī)則后。服務(wù)器從數(shù)據(jù)庫(kù)中找到相應(yīng)的執(zhí)行指令通過json文件下發(fā)給終端設(shè)備。

數(shù)據(jù)庫(kù)將指令下發(fā)給終端設(shè)備。設(shè)備實(shí)行完指令后，如果成功執(zhí)行，則將成功碼反饋給服務(wù)器，然后服務(wù)器在進(jìn)行第二條執(zhí)行指令的下發(fā)，直到完成最終的指令。如果終端正確執(zhí)行指令，則服務(wù)器收到完成指令后下發(fā)完成語音。終端將完成語音廣播出去。如果終端沒有正確執(zhí)行，則將錯(cuò)誤碼反饋給服務(wù)器。服務(wù)器根據(jù)反饋的錯(cuò)誤碼下發(fā)預(yù)制的語音數(shù)據(jù)給終端設(shè)備。

3 結(jié)束語

綜上所述，以服務(wù)器為核心的語音控制系統(tǒng)由于使用服務(wù)器進(jìn)行語音的處理和合成，所以，可以有效的改善提高語音合成的效率和合成音質(zhì)，避免了傳統(tǒng)語音控制系統(tǒng)的合成詞匯有限的弊端。此外，隨著相關(guān)研究人員在這一方面的工作經(jīng)驗(yàn)的不斷豐富，手持終端設(shè)備的不斷的多樣化，這種語音控制系統(tǒng)語音識(shí)別和合成的效果會(huì)大大優(yōu)化，語音控制的效率和準(zhǔn)確度能夠大幅度提高，并廣泛的應(yīng)用于工作和生活中。

[1] 范會(huì)敏，何鑫.中文語音合成系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)系統(tǒng)應(yīng)用，2017，（02）：73-77.

[2] 張仕良.基于深度神經(jīng)網(wǎng)絡(luò)的語音識(shí)別模型研究[D].中國(guó)科學(xué)技術(shù)大學(xué)，2017.