亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        連續(xù)語音識別技術及其應用前景分析

        2016-04-21 01:47:43陳擁權李建中鄭榮穩(wěn)魯加旺
        數(shù)碼世界 2016年1期
        關鍵詞:馬爾可夫語音單詞

        陳擁權 李建中 鄭榮穩(wěn) 魯加旺

        合肥寰景信息技術有限公司

        ?

        連續(xù)語音識別技術及其應用前景分析

        陳擁權 李建中 鄭榮穩(wěn) 魯加旺

        合肥寰景信息技術有限公司

        摘要:連續(xù)語音識別技術,是集語音處理、模式識別、句法和語義分析于一體的綜合性語音處理技術,能夠識別任意的連續(xù)語音,如一個句子或一段話,大大提高了語音交互的連續(xù)性和體驗度,是語音識別技術的核心之一。本文介紹了連續(xù)語音識別技術的研究現(xiàn)狀及幾種常見的技術方法,并且分析探討了連續(xù)語音識別技術的應用和發(fā)展前景。

        1 引言

        近期,語音識別在移動終端上的應用最為火熱,語音對話機器人、語音助手、互動工具等層出不窮,許多互聯(lián)網(wǎng)公司紛紛投入人力、物力和財力展開此方面的研究和應用,目的是通過語音交互的新穎和便利模式迅速占領客戶群。但是,面向個人用途的連續(xù)語音聽寫仍然面臨極大的技術挑戰(zhàn),尤其是對自然語言的識別和理解,因此連續(xù)語音識別技術及其應用的研究迫在眉睫。本文介紹了連續(xù)語音識別技術的研究現(xiàn)狀及幾種常見的技術方法,并且分析探討了連續(xù)語音識別技術的應用和發(fā)展前景。

        2 連續(xù)語音識別技術的難點

        (1)單詞切分難點:連續(xù)語音句子中各單詞的發(fā)音之間通常是沒有停頓的,即各單詞之間不存在明顯的邊界。

        (2)發(fā)音變化難點:連續(xù)語音中各單詞的發(fā)音通常都比較自然和隨便,因而,各單詞受協(xié)同發(fā)音的影響也更為嚴重。

        (3)連續(xù)單詞語音識別難點:單詞序列的長度未知;單詞序列中各單詞之間的邊界未知;當給定M個單詞參考模式和L長的待識語音模式時,就可能有ML種組合的匹配序列。

        3 連續(xù)語音識別的基本原理

        3.1技術核心:聲學模型 (HMM)和語言模型 (N-gramm)

        聲學模型是語音識別系統(tǒng)中最為重要的部分之一,目前的主流系統(tǒng)多采用隱馬爾科夫模型進行建模。隱馬爾可夫模型的概念是一個離散時域有限狀態(tài)自動機,隱馬爾可夫模型HMM是指這一馬爾可夫模型的內(nèi)部狀態(tài)外界不可見,外界只能看到各個時刻的輸出值。

        語言模型是一個單純的、統(tǒng)一的、抽象的形式系統(tǒng),語言客觀事實經(jīng)過語言模型的描述,比較適合于電子計算機進行自動處理,因而語言模型對于自然語言的信息處理具有重大的意義。

        3.2基本思路

        連續(xù)語音識別系統(tǒng)的參考模式由孤立單詞的參考模式按時間順序動態(tài)接續(xù)組合而成,識別系統(tǒng)把待識連續(xù)單詞語音和被接續(xù)起來的單詞模式序列進行匹配比較,距離最短的單詞參考模式之序列就為識別結(jié)果。

        圖2 連續(xù)單詞的語音識別過程

        3.3典型技術解決方案

        連續(xù)語音句子中每個單詞發(fā)音沒有明顯的界限,分割比較困難。目前比較典型的技術解決方案是:基于隱馬爾可夫模型(Hidden Markov Model,HMM)的連續(xù)語音識別系統(tǒng)。

        3.1 術前心理護理的效果 患者術前常易產(chǎn)生恐懼心理,緊張情緒增加患者心理壓力,護士應與患者在泌尿外科微創(chuàng)術前進行心理疏導與溝通,講解微創(chuàng)手術的優(yōu)越性及各種導管的性能作用,取得患者積極配合,避免因情緒波動致血壓升高等而影響手術。

        該識別系統(tǒng)在訓練過程中采用逐步細化的建模過程,先建立單音素的HMM,然后考慮音素上下文,擴展到三音素HMM,最后進行狀態(tài)捆綁,還可逐步增加混合高斯變量數(shù)目,最終得到魯棒性較高的連續(xù)語音識別HMM。

        圖3 基于HMM的連續(xù)語音識別系統(tǒng)架構圖

        4 連續(xù)語音識別的技術方法

        4.1兩級DP法 (Two-Level Dynamic Programming)

        計算任意起始幀b和終止幀e之間的最佳累計距離D(b, e)

        4.2分層構造法 (Level Building)

        使用HMM的概率參數(shù)來對似然函數(shù)進行估計與判決,從而得到結(jié)果。

        5 連續(xù)語音識別技術的發(fā)展方向

        目前語音信號處理技術的發(fā)展方向及研究熱點主要體現(xiàn)在以下幾個方面。

        5.1語音識別單元的選取

        5.2特征參數(shù)提取技術

        對語音信號進行分析處理,去除對語音識別無關緊要的冗余信息,獲得影響語音識別的重要信息。Mel參數(shù)和基于感知線性預測(PLP)分析提取的感知線性預測倒譜,應用了人耳聽覺感知方面的研究成果。實驗證明,采用這種技術,語音識別系統(tǒng)的性能有一定提高。

        5.3模式匹配及模型訓練技術

        語音識別所應用的模式匹配和模型訓練技術主要有動態(tài)時間歸正技術(DTW)、隱馬爾可夫模型(HMM)和人工神經(jīng)元網(wǎng)絡(ANN)。

        DTW是較早的一種模式匹配和模型訓練技術,在孤立詞語音識別中獲得了良好性能。但因其不適合連續(xù)語音大詞匯量語音識別系統(tǒng),目前已被HMM模型和ANN替代。

        HMM模型是語音信號時變特征的有參表示法。HMM模型的訓練和識別都已研究出有效的算法,并不斷被完善,以增強HMM模型的魯棒性。

        人工神經(jīng)元網(wǎng)絡在語音識別中的應用是現(xiàn)在研究的又一熱點。其本質(zhì)上是一個自適應非線性動力學系統(tǒng),模擬了人類神經(jīng)元活動的原理,具有自學、聯(lián)想、對比、推理和概括能力。

        目前的研究熱點是將 HMM 和 ANN 二者的優(yōu)點有機結(jié)合起來,從而提高整個模型的魯棒性。

        6 連續(xù)語音識別技術的應用前景分析

        連續(xù)語音識別技術的應用主要是大詞匯量連續(xù)語音識別系統(tǒng),可應用于計算機的聽寫機,以及與電話網(wǎng)或者互聯(lián)網(wǎng)相結(jié)合的語音信息查詢服務系統(tǒng),而這些系統(tǒng)都是在計算機平臺上實現(xiàn)的。

        6.1個人數(shù)字助理

        個人數(shù)字助理(Personal Digital Assistant,PDA)的語音交互界面。PDA的體積很小,人機界面一直是其應用和技術的瓶頸之一。現(xiàn)在業(yè)界一致認為,PDA的最佳人機交互界面是以語音作為傳輸介質(zhì)的交互方法,并且已有少量應用。隨著語音識別技術的提高,可以預見,在不久的將來,語音將成為PDA主要的人機交互界面。

        6.2家電遙控

        用語音可以控制電視機、VCD、空調(diào)、電扇、窗簾的操作,而且一個遙控器就可以把家中的電器皆用語音控起來,這樣,可以讓令人頭疼的各種電器的操作變得簡單易行。

        6.3汽車的語音控制

        在汽車的行駛過程中,駕駛員的手必須放在方向盤上,因此在汽車上撥打電話,需要使用具有語音撥號功能的免提電話通信方式。此外,對汽車的衛(wèi)星導航定位系統(tǒng)(GPS)的操作,汽車空調(diào)、照明以及音響等設備的操作,同樣也可以由語音來方便的控制。

        6.4智能玩具

        通過語音識別技術,我們可以與智能娃娃對話,可以用語音對玩具發(fā)出命令,讓其完成一些簡單的任務,甚至可以制造具有語音鎖功能的電子看門狗。智能玩具有很大的市場潛力,而其關鍵在于降低語音芯片的價格。

        除了上述應用以外,連續(xù)語音識別技術在其他方面的應用可以說是不勝枚舉,將給人們的工作和生活帶來極大的方便。

        國家科技支撐計劃,網(wǎng)絡社區(qū)語音互動服務關鍵支撐技術研發(fā),2012BAH95F01

        參考文獻

        [1]黃浩,朱杰,哈力旦.漢語語音識別中的區(qū)分性聲調(diào)建模方法[J].計算機工程與應用.2009(11)

        [2]倪崇嘉,劉文舉,徐波.漢語大詞匯量連續(xù)語音識別系統(tǒng)研究進展[J].中文信息學報.2009(01)

        [3]李凈,鄭方,張繼勇,吳文虎.漢語連續(xù)語音識別中上下文相關的聲韻母建模[J].清華大學學報(自然科學版).2004(01)

        [4]韓兆兵,賈磊,張樹武,徐波.連續(xù)語音識別中聲學建模的組合聚類算法研究[J].中文信息學報.2003(04)

        [5]李虎生,劉加,劉潤生.語音識別說話人自適應研究現(xiàn)狀及發(fā)展趨勢[J].電子學報.2003(01)

        基金項目

        關鍵字:語音識別 連續(xù)語音 聲學模型 語言模型

        猜你喜歡
        馬爾可夫語音單詞
        單詞連一連
        魔力語音
        基于MATLAB的語音信號處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價廉物美的酒駕語音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        看圖填單詞
        看完這些單詞的翻譯,整個人都不好了
        保費隨機且?guī)в屑t利支付的復合馬爾可夫二項模型
        基于SOP的核電廠操縱員監(jiān)視過程馬爾可夫模型
        應用馬爾可夫鏈對品牌手機市場占有率進行預測
        观看在线人视频| 久久精品熟女不卡av高清| 婷婷五月亚洲综合图区| 日本精品一区二区三区在线播放 | 蜜桃18禁成人午夜免费网站| 国产精品美女久久久久av福利| 丁香花在线影院观看在线播放 | 国产一区二区三区免费在线播放 | 人人人妻人人人妻人人人| 国产精品∧v在线观看| 成 人 网 站 免 费 av| 伊人狠狠色j香婷婷综合| 日本熟妇裸体视频在线| 91精品人妻一区二区三区久久久| 韩国三级大全久久网站| 久久老子午夜精品无码怎么打| 国产成人精品日本亚洲专区6| 日本高清一区二区在线观看| 精品一级一片内射播放| 挺进邻居丰满少妇的身体| 亚洲精品国产福利一二区| 亚洲欧洲日产国码久在线| 国产亚洲av一线观看| 尤物在线观看一区蜜桃| а天堂中文在线官网| 国产乱子伦精品无码码专区| 国产亚洲三级在线视频| 毛片在线播放亚洲免费中文网 | 无码夜色一区二区三区| 女同另类激情在线三区| 亚洲视频在线观看第一页| 夹得好湿真拔不出来了动态图| 中文字幕日本特黄aa毛片| 啪啪网站免费观看| 99亚洲女人私处高清视频| 国产av无码专区亚洲a∨毛片 | 免费的日本一区二区三区视频| 国产成人精品久久一区二区三区| 欧美在线成人午夜网站| 日本熟女人妻一区二区三区| 19款日产奇骏车怎么样|