亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)

        2018-12-31 05:42:38劉敏
        移動(dòng)信息 2018年9期
        關(guān)鍵詞:架構(gòu)設(shè)計(jì)語(yǔ)音模板

        劉敏

        計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)

        劉敏

        山東勝軟科技股份有限公司,山東 東營(yíng) 257000

        近些年,隨著計(jì)算機(jī)技術(shù)的普及,計(jì)算機(jī)產(chǎn)品已成為人們工作生活中不可或缺的產(chǎn)品,在這樣的形式下需要提升計(jì)算機(jī)平臺(tái)媒體的便捷性?,F(xiàn)階段語(yǔ)音識(shí)別系統(tǒng)是最好的轉(zhuǎn)變選擇。語(yǔ)音識(shí)別系統(tǒng)的主要原理是計(jì)算機(jī)設(shè)備使用自己的語(yǔ)音識(shí)別和理解系統(tǒng)將語(yǔ)音信號(hào)轉(zhuǎn)換成文本文件或以命令的形式輸出。計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的主要任務(wù)是提取語(yǔ)音信息和識(shí)別語(yǔ)音信號(hào)的含義。經(jīng)過(guò)幾十年的研究和開(kāi)發(fā),目前的語(yǔ)音識(shí)別技術(shù)在計(jì)算機(jī)軟硬件的指導(dǎo)下取得了很好的成果。如果研究人員和設(shè)計(jì)者設(shè)計(jì)出一種能夠在單片機(jī)上實(shí)現(xiàn)語(yǔ)音識(shí)別的系統(tǒng),這將具有重要意義。因此,相關(guān)人員應(yīng)使用VC++過(guò)程模擬來(lái)開(kāi)發(fā)一個(gè)小詞匯量、獨(dú)立的單詞識(shí)別系統(tǒng),并建立一個(gè)更完善的計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)。

        計(jì)算機(jī);語(yǔ)音識(shí)別系統(tǒng);架構(gòu)設(shè)計(jì)

        1 簡(jiǎn)述計(jì)算技術(shù)語(yǔ)音識(shí)別系統(tǒng)技術(shù)

        從計(jì)算機(jī)的發(fā)明到現(xiàn)在的普及,在操作計(jì)算機(jī)時(shí)一直是在使用鍵盤,但是在現(xiàn)實(shí)的世界中還有一種物質(zhì)可以將計(jì)算機(jī)與人們進(jìn)行聯(lián)系,這就是聲音。合理利用聲音構(gòu)建起人與計(jì)算機(jī)間的聯(lián)系就是計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)。簡(jiǎn)單地說(shuō),計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)是計(jì)算機(jī)傾聽(tīng)人類語(yǔ)言的一種工程。當(dāng)人們對(duì)著計(jì)算機(jī)說(shuō)話時(shí),計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)會(huì)將其理解成“語(yǔ)言”,并將其輸入內(nèi)部系統(tǒng),利用相關(guān)程序?qū)⒄Z(yǔ)音信息轉(zhuǎn)化為文本形式。在識(shí)別過(guò)程中,計(jì)算機(jī)根據(jù)語(yǔ)音識(shí)別模型將存儲(chǔ)在計(jì)算機(jī)中的語(yǔ)音模板的特征與輸入語(yǔ)音信號(hào)進(jìn)行比較,并根據(jù)一定的搜索和匹配策略找到一系列與輸入語(yǔ)音匹配的最佳模板。然后,根據(jù)模板的定義,可以參考表格給出計(jì)算機(jī)的識(shí)別結(jié)果。顯然,這個(gè)優(yōu)化結(jié)果直接關(guān)系特征選擇、語(yǔ)音模型質(zhì)量和模板精度[1]。

        2 語(yǔ)音識(shí)別技術(shù)的發(fā)展現(xiàn)狀

        通過(guò)多年的研究與努力,語(yǔ)音識(shí)別技術(shù)也得到了非常大的發(fā)展。語(yǔ)音識(shí)別已經(jīng)由研發(fā)階段發(fā)展到實(shí)際使用階段。在試驗(yàn)階段語(yǔ)音識(shí)別信號(hào)最好的情況下使用者連續(xù)進(jìn)行朗讀,信號(hào)的識(shí)別率可達(dá)到90%以上。因此語(yǔ)音識(shí)別技術(shù)也從試驗(yàn)階段轉(zhuǎn)換到實(shí)際應(yīng)用階段,實(shí)現(xiàn)了商業(yè)化。通過(guò)相關(guān)學(xué)者的研究已有兩大聽(tīng)寫設(shè)備,即IBM ViaVoice和Dragon Dictation。語(yǔ)音識(shí)別技術(shù)也從一開(kāi)始的小眾化發(fā)展到現(xiàn)在的大眾化。語(yǔ)音識(shí)別系統(tǒng)在進(jìn)行語(yǔ)音識(shí)別時(shí)可以校對(duì)語(yǔ)言并糾正錯(cuò)誤信息,在此基礎(chǔ)上保證語(yǔ)音識(shí)別的速度與質(zhì)量。因此,為了充分發(fā)揮語(yǔ)音識(shí)別技術(shù)的應(yīng)用優(yōu)勢(shì),確保該系統(tǒng)能夠克服不同環(huán)境和口音造成的識(shí)別偏差,相關(guān)研究人員應(yīng)進(jìn)行進(jìn)一步研究,以克服這些問(wèn)題,并在此基礎(chǔ)上確保語(yǔ)音識(shí)別系統(tǒng)能夠更好地應(yīng)用于實(shí)際生產(chǎn)和生活[1]。從現(xiàn)階段來(lái)看,現(xiàn)有的語(yǔ)音識(shí)別系統(tǒng)在識(shí)別特殊單詞方面發(fā)揮了很好的作用,特別是在電話查詢、電話交換和數(shù)字字符串設(shè)置方面。接收這些任務(wù)后,系統(tǒng)不僅可以自動(dòng)接收和存儲(chǔ)信息,還可以實(shí)現(xiàn)實(shí)際數(shù)據(jù)與實(shí)驗(yàn)室數(shù)據(jù)的一致性,確保100%的識(shí)別率。但是可以限制語(yǔ)音識(shí)別系統(tǒng)的因素也相對(duì)較多,因此相關(guān)的技術(shù)人員還應(yīng)對(duì)此項(xiàng)技術(shù)進(jìn)行進(jìn)一步的研發(fā)與優(yōu)化[2]。

        3 計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)

        3.1 用戶界面模塊

        計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)中用戶界面模塊的主菜單主要包括運(yùn)行過(guò)程中的識(shí)別程序,并且可以選擇要在工具欄中顯示的波形原始圖或波形處理圖。此模塊中的狀態(tài)欄包括一個(gè)消息對(duì)話框和一個(gè)狀態(tài)顯示,并監(jiān)控系統(tǒng)中的軟件。

        3.2 語(yǔ)音信號(hào)采集模塊

        語(yǔ)音識(shí)別系統(tǒng)中語(yǔ)音信號(hào)采集模塊的主要任務(wù)是將聽(tīng)到的聲音記錄到系統(tǒng)中,然后用MGI功能記錄聽(tīng)到的聲音,最后得到帶有MGI功能的指令和消息。錄音過(guò)程中的聲音輸入通過(guò)麥克風(fēng)完成,并存儲(chǔ)在定制模板中,該模板可用作WAV文件[3]。

        3.3 特征值提取模塊

        每一段語(yǔ)音信號(hào)都具有一定的代表性但不是很穩(wěn)定,因此無(wú)法對(duì)有爭(zhēng)端的語(yǔ)音進(jìn)行識(shí)別與處理。當(dāng)出現(xiàn)此情況時(shí)可以將其切割成長(zhǎng)度不等的語(yǔ)音信號(hào),在滿足相關(guān)信號(hào)處理?xiàng)l件下可以運(yùn)用相關(guān)的公式進(jìn)行計(jì)算并對(duì)信號(hào)進(jìn)行處理[4]。目前,最常用的參數(shù)是:平衡振幅、短期能量和電流預(yù)測(cè)系統(tǒng)。在實(shí)際處理中,可以首先將輸入語(yǔ)音波形轉(zhuǎn)換成另一組離散參數(shù)向量。然后提取語(yǔ)音特征,主要是獲取能夠通過(guò)語(yǔ)音產(chǎn)生的波形反映語(yǔ)音特征的主要信息,排除一些不相關(guān)的語(yǔ)音信息。最典型的方案是收集樣本信號(hào)。首先,不同的時(shí)間間隔可以通過(guò)開(kāi)窗來(lái)分開(kāi),然后可以在此基礎(chǔ)上設(shè)置時(shí)間間隔[5],最常見(jiàn)的設(shè)定間隔為1~50 ms,最后可以在不同的間隔幀上提取不同的特征矢量。在這其中較簡(jiǎn)單的特征分為短時(shí)能量和過(guò)零率兩種,但其頻率特征相對(duì)是比較穩(wěn)定的。LPC分析是其中比較典型的特征,可以直接反映共振峰值的性質(zhì)。

        3.4 特征庫(kù)管理模塊

        特征庫(kù)中的一些相關(guān)參數(shù)可以分為兩類:一類是音頻文件、語(yǔ)音揚(yáng)聲器名稱和語(yǔ)音內(nèi)容等:一類是信號(hào)處理后產(chǎn)生的相關(guān)聲音內(nèi)容的語(yǔ)音特征參數(shù)。兩者都設(shè)置了相應(yīng)的誤差范圍。

        3.5 模式識(shí)別模塊

        模塊識(shí)別模塊可以收集用戶發(fā)出的聲音并監(jiān)控其終端,最終提取其特征。提取的聲音應(yīng)與模板一致,并且可以用作識(shí)別的最終結(jié)果。匹配的主要方式是矢量可變距離。矢量量化是指特征值中的參數(shù)來(lái)構(gòu)造相應(yīng)的特征值,它們之間的加權(quán)距離可以在匹配過(guò)程中計(jì)算出來(lái)。匹配后獲得的加權(quán)距離越小,兩者之間的距離越近。如果匹配在誤差范圍內(nèi)就是成功;如果匹配在誤差范圍外則不成功,可以根據(jù)系統(tǒng)中的動(dòng)力學(xué)產(chǎn)生的誤差來(lái)確定它是否是預(yù)期模板[6]。

        4 計(jì)算機(jī)語(yǔ)言識(shí)別技術(shù)的發(fā)展趨勢(shì)

        在科技的帶動(dòng)下,計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)也在不斷完善與更新,其良好的特征也完美地呈現(xiàn)在人們面前。計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的特征主要體現(xiàn)在從認(rèn)識(shí)到語(yǔ)音識(shí)別技術(shù)的發(fā)展趨勢(shì),并逐漸滿足社會(huì)發(fā)展的需要,利用獨(dú)有的特點(diǎn)與專業(yè)性技術(shù)來(lái)解決不同領(lǐng)域中遇到的問(wèn)題。此外,可以看出計(jì)算機(jī)語(yǔ)言識(shí)別系統(tǒng)使用范圍非常廣泛,可被利用到不同的領(lǐng)域中。如將其應(yīng)用到通信領(lǐng)域中,應(yīng)將大量的與通信領(lǐng)域相關(guān)的詞匯利用專業(yè)的語(yǔ)音識(shí)別系統(tǒng)進(jìn)行輸入。這樣既可以提升語(yǔ)音識(shí)別系統(tǒng)的清晰性,又可以提升其定位功能的準(zhǔn)確性,充分發(fā)揮計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的作用。計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)也在計(jì)算機(jī)技術(shù)的發(fā)展中取得了突破性進(jìn)展,并逐漸擴(kuò)展到日常工作和生活中。集成不同的語(yǔ)言可以共享相關(guān)的任務(wù)。更令人驚訝的是,計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)能夠收集、總結(jié)和分析大量詞匯信息,從而突破了多語(yǔ)言的限制。

        5 結(jié)語(yǔ)

        通過(guò)近些年來(lái)對(duì)計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的進(jìn)一步研究,利用VC++技術(shù)可以構(gòu)建起一個(gè)更加完善的語(yǔ)音識(shí)別系統(tǒng),并在模擬后實(shí)現(xiàn)對(duì)系統(tǒng)的調(diào)試。在現(xiàn)代移植技術(shù)的輔助下實(shí)現(xiàn)了將系統(tǒng)移植到單片機(jī)上,有效地提升了計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的處理效果,達(dá)到最初的處理與控制目的。

        [1]郭洪榮. 計(jì)算機(jī)語(yǔ)音識(shí)別技術(shù)的應(yīng)用分析[J]. 黑龍江科技信息,2012(31):96.

        [2]高忠生,高紅琴. 計(jì)算機(jī)語(yǔ)音識(shí)別系統(tǒng)的架構(gòu)設(shè)計(jì)[J]. 信息記錄材料,2013,14(3):50-53.

        [3]高翔. 計(jì)算機(jī)語(yǔ)音錄入系統(tǒng)中準(zhǔn)確性問(wèn)題的研究[J].自動(dòng)化與儀器儀表,2015(2):103-104.

        [4]茍鵬程. 基于Android的語(yǔ)音識(shí)別設(shè)計(jì)及應(yīng)用[D]. 天津:天津大學(xué),2017.

        [5]李剛. 智能語(yǔ)音識(shí)別技術(shù)的架構(gòu)與設(shè)計(jì)[J]. 電腦知識(shí)與技術(shù),2018(18):175-177.

        [6]王青偉,馬鐲,崔琳,等. 語(yǔ)音識(shí)別領(lǐng)域計(jì)算機(jī)程序或算法專利申請(qǐng)審查[J]. 電聲技術(shù),2012,36(S1):50-52.

        Architecture Design of Computer Speech Recognition System

        Liu Min

        Shandong Victorysoft Co., Ltd., Shandong Dongying 257000

        In recent years, with the popularization of computer technology, computer products have become an indispensable product in people’s work and life. In this form, the convenience of the computer platform media needs to be improved. It can be said that the current stage of speech recognition system is the best choice for transformation. The main principle of the speech recognition system is that the computer device uses its own speech recognition and understanding system to convert the speech signal into a text file or output in the form of a command. The main task of the computer speech recognition system is to extract speech information and recognize the meaning of the speech signal. After decades of research and development, the current speech recognition technology has achieved high results under the guidance of computer hardware and software. It would be important if researchers and designers design a system that can implement speech recognition on a micro controller. Therefore, relevant personnel should use VC++process simulation to develop a small vocabulary and independent word recognition system, and establish a more complete computer speech recognition system.

        computer; speech recognition system; architecture design

        TN912.34

        A

        猜你喜歡
        架構(gòu)設(shè)計(jì)語(yǔ)音模板
        鋁模板在高層建筑施工中的應(yīng)用
        鋁模板在高層建筑施工中的應(yīng)用
        基于安全性需求的高升力控制系統(tǒng)架構(gòu)設(shè)計(jì)
        魔力語(yǔ)音
        基于MATLAB的語(yǔ)音信號(hào)處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對(duì)方正在輸入……
        鋁模板在高層建筑施工中的應(yīng)用
        城市綜改 可推廣的模板較少
        對(duì)稱加密算法RC5的架構(gòu)設(shè)計(jì)與電路實(shí)現(xiàn)
        成人爽a毛片在线视频| 全国一区二区三区女厕偷拍| 国产一区二区av免费在线观看| 国产精品亚洲а∨无码播放不卡| 国产麻无矿码直接观看| 日韩中文字幕久久久经典网 | 精品高清一区二区三区人妖| 综合五月激情二区视频| 无码手机线免费观看| 国产精品国产三级国产av创| 免费女女同黄毛片av网站| 亚洲成a人片在线观看无码专区| 男受被做哭激烈娇喘gv视频| 日本a在线免费观看| 中文字幕人妻av四季| 国产精品 无码专区| 国产乱子伦视频大全| 被暴雨淋湿爆乳少妇正在播放| 精品精品国产三级av在线| 免费国产成人肉肉视频大全| 国产成人精品日本亚洲18| 亚洲av乱码一区二区三区女同| 在线观看 国产一区二区三区 | 青草视频在线播放| 日本在线观看不卡| 一级内射免费观看视频| 国产亚洲精品久久久闺蜜| 色偷偷88888欧美精品久久久| 日韩精品一区二区av在线| 岛国熟女精品一区二区三区| 国语精品一区二区三区| 精品一区二区三区免费爱| 丝袜美腿一区在线观看| 韩国三级大全久久网站| 狠狠久久久久综合网| 久久夜色精品国产九色| 中文字幕人妻丝袜成熟乱| 97精品依人久久久大香线蕉97| 亚洲AV秘 片一区二区三区 | 麻豆果冻传媒在线观看| 午夜影视啪啪免费体验区入口|