亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        在線連續(xù)交互式英語語音智能識別系統(tǒng)設(shè)計

        2017-09-04 15:44:02趙丹鐘楠
        現(xiàn)代電子技術(shù) 2017年15期
        關(guān)鍵詞:在線語音

        趙丹+鐘楠

        摘 要: 英語語音智能識別系統(tǒng)的發(fā)展方向是在線、連續(xù)性的人機交互,為此,設(shè)計在線連續(xù)交互式英語語音智能識別系統(tǒng),并基于梅爾頻率倒譜系數(shù)設(shè)計語音識別函數(shù)。系統(tǒng)的參考數(shù)據(jù)庫選取NOSE算法計算語音評價分?jǐn)?shù)并查錯,利用專家知識庫糾正用戶英語語音。系統(tǒng)由語音訓(xùn)練模塊和在線連續(xù)交互式識別模塊組成,前者為系統(tǒng)數(shù)據(jù)庫提供英語語音的語料、音標(biāo)資源,后者實施系統(tǒng)數(shù)據(jù)庫的評價、糾正工作。實驗結(jié)果證明設(shè)計的系統(tǒng)語音識別率高且識別時間短,有效性強。

        關(guān)鍵詞: 在線; 連續(xù)交互式; 語音; 智能識別系統(tǒng)

        中圖分類號: TN912.34?34 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2017)15?0137?04

        Abstract: The development direction of English phonetics intelligent recognition system towards the on?line and continuous human?computer interaction, therefore an on?line continuous interactive English phonetics intelligent recognition system was designed. The voice recognition function based on Mel frequency cepstrum coefficient was designed. The NOSE algorithm is selected in system reference database to calculate the voice evaluation score and check the error. The expert knowledge base is used to correct the English phonetics of users. The system is composed of the speech training module and on?line continuous interactive module. The former provides the corpus and phonetic resources of English phonetics for the system database. The latter performs the evaluation and correction for the system database. The experimental results show that the system has high speech recognition rate, short recognition time, and high effectiveness.

        Keywords: online system; continuous interaction; voice; intelligent recognition system

        0 引 言

        英語是國際語言,隨著各國間經(jīng)濟、人文、科技等信息交流的不斷加深,英語語音智能識別漸漸成為信息技術(shù)領(lǐng)域的重點研究對象,其目標(biāo)是使用機器達(dá)成設(shè)備與人類之間的語音交互,令設(shè)備更加智能化,增加娛樂能力,為不方便進行鍵盤、鼠標(biāo)錄入的人群提供便利。

        英語語音智能識別的目標(biāo)符合現(xiàn)代化發(fā)展腳步,英語語音智能識別系統(tǒng)層出不窮,第一款識別系統(tǒng)名為Audry系統(tǒng),各項性能比較完善,現(xiàn)已得到極大發(fā)展。最近新出的Audry系統(tǒng)利用數(shù)據(jù)庫計算手段從英語基礎(chǔ)語法開始對語音的元音和獨立詞進行識別,識別率高,但識別時間長,只適合進行短小語句識別。1963年,由前蘇聯(lián)設(shè)計的端點檢測系統(tǒng)使用動態(tài)編程實現(xiàn)英語語音識別,系統(tǒng)的實時性不好,對在線、連續(xù)性的英語語音識別力不強。此后,著名的貝爾實驗室[1]改變了語音識別研究方向,設(shè)計出一個語音打印機,將英語語音翻譯在設(shè)備顯示屏上,再進行人機交互,在智能手機中被普遍應(yīng)用,其功能少但識別精準(zhǔn)。從1980年開始,HMM(Hidden Markov Model,隱馬爾可夫模型)[2]系統(tǒng)進入到人們的生活中,其結(jié)合了Audry系統(tǒng)的計算手段以及語音打印機的人機交互能力并進行改善,從細(xì)節(jié)語音識別轉(zhuǎn)換成整體語音識別,增進了在線、連續(xù)性英語語音信號的平穩(wěn)性,是語音智能識別歷史中的重要里程碑。

        顯然,英語語音智能識別系統(tǒng)的發(fā)展方向是在線、連續(xù)性的人機交互,對識別效率要求高,如果能夠在最短的時間糾正語音錯誤,也可以極大提高系統(tǒng)識別率,這是在英語語音智能識別系統(tǒng)設(shè)計中的研究熱點。

        1 在線連續(xù)交互式英語語音智能識別系統(tǒng)設(shè)計

        在線連續(xù)交互式英語語音智能識別系統(tǒng)主要由語音訓(xùn)練模塊和在線連續(xù)交互式識別模塊組成,重點設(shè)計系統(tǒng)工作流程和模塊資源。

        1.1 工作流程設(shè)計

        在線連續(xù)交互式英語語音智能識別系統(tǒng)工作流程如圖1所示。

        系統(tǒng)擁有兩個數(shù)據(jù)庫,分別是參考數(shù)據(jù)庫和專家數(shù)據(jù)庫。參考數(shù)據(jù)庫的作用是對用戶英語語音進行評價,由英語標(biāo)準(zhǔn)發(fā)音特征進行訓(xùn)練。參考數(shù)據(jù)庫使用的語音評價算法是NOSE算法[3],是一種非母語語音的口語評價技術(shù)。專家數(shù)據(jù)庫的作用是糾正用戶英語語音,它在常見的英語口語發(fā)音錯誤的基礎(chǔ)上構(gòu)建。

        系統(tǒng)從用戶英語語音中提取特征,用訓(xùn)練成功的參考數(shù)據(jù)庫解碼英語語音,使用NOSE算法計算語音評價分?jǐn)?shù),將分?jǐn)?shù)變更成能夠展現(xiàn)出用戶英語語音口語質(zhì)量的評價項目,之后對語音進行查錯,最后利用專家知識庫糾正用戶英語語音。

        由于在線連續(xù)交互式英語語音智能識別系統(tǒng)一般用于手機和平板電腦,硬件配備不多[4],因此系統(tǒng)的工作流程必須完美實現(xiàn),并在NOSE算法的計算過程中選取盡可能多的備選語音,制定英語音標(biāo)順序,進而減少運算量,節(jié)約語音識別時間。

        1.2 系統(tǒng)模塊資源設(shè)計

        1.2.1 語音訓(xùn)練模塊

        語音訓(xùn)練模塊為參考數(shù)據(jù)庫和專家數(shù)據(jù)庫提供資源,資源包括英語語音的語料和音標(biāo),在線連續(xù)交互式英語語音智能識別系統(tǒng)的功能在很大程度上受限于數(shù)據(jù)庫資源,尤其是語料資源[5]。好的語料資源可增進識別結(jié)果的有效性,系統(tǒng)要求語音訓(xùn)練模塊的語料資源具有廣泛性、代表性和一致性三種特點[6]。廣泛性要求語料結(jié)構(gòu)類型兼容性強,涵蓋大多數(shù)的英語口語發(fā)音規(guī)則。代表性要求語料資源中含有性別、年紀(jì)、語速和方言等資源。一致性要求語料標(biāo)記點具體且詳細(xì),能夠與用戶英語語音對應(yīng)一致。

        組織我國多所不同地域的外國語大學(xué)教授錄制語料資源,男女人數(shù)各50人,每人錄制40分鐘英語語音,共計2 300句,包含1 600個英語單詞。錄制結(jié)束后對語音中的單詞等級進行標(biāo)記,組成語料資源,表1為錄制過程中的英語語音采集標(biāo)準(zhǔn)。

        語音訓(xùn)練模塊音標(biāo)資源是英語的48個音標(biāo),包括20個元音、28個輔音,元音包括12個單元音和8個雙元音。解析音標(biāo)資源,參考數(shù)據(jù)庫或?qū)<覕?shù)據(jù)庫中一同出現(xiàn)3個單詞的幾率為:

        式中:表示單個單詞出現(xiàn)的幾率;表示2個單詞一同出現(xiàn)的幾率。式(1)決定著數(shù)據(jù)庫的工作強度。

        1.2.2 在線連續(xù)交互式識別模塊

        在線連續(xù)交互式識別模塊實施系統(tǒng)數(shù)據(jù)庫的評價、糾正工作,模塊將進行大量運算,需要處理芯片支持運算。DSP芯片[7](Digital Signal Processing,信號處理芯片)適合處理數(shù)字信號,其體積小、價格便宜,適合安裝在手機和平板電腦上使用。DSP芯片還具有強大的在線交互能力,處理速度快。在線連續(xù)交互式識別模塊選擇的DSP芯片是OMAP 5912ZZG[8],該芯片內(nèi)部配置了開發(fā)工具,多媒體數(shù)據(jù)庫、DSP操作系統(tǒng)、鏈橋技術(shù)均能夠免費使用,圖2是OMAP 5912ZZG芯片結(jié)構(gòu)。

        圖2中,OMAP 5912ZZG芯片存儲處理器規(guī)格是250 KB的隨存隨取存儲器,作用是對英語語音數(shù)據(jù)和液晶顯示屏的顯示數(shù)據(jù)進行緩沖。內(nèi)存卡用于進行系統(tǒng)內(nèi)存擴展,交互式矢量圖對音頻進行幀緩沖。英語語音在線連續(xù)交互的實現(xiàn)由存儲處理器完成,它支持多種處理模式。OMAP 5912ZZG芯片能夠?qū)τ⒄Z語音識別任務(wù)進行內(nèi)存分配,并經(jīng)由以太網(wǎng)接口移植出語音識別函數(shù)。在線連續(xù)交互式識別模塊進行語音識別時,OMAP 5912ZZG芯片的地位是協(xié)同處理器,主處理器是用戶手機或平板電腦上的微處理器。

        2 語音識別函數(shù)設(shè)計

        語音識別函數(shù)是在線連續(xù)交互式英語語音智能識別系統(tǒng)的基礎(chǔ)識別函數(shù),識別流程如圖3所示。

        語音識別函數(shù)的本質(zhì)是一種梅爾頻率倒譜系數(shù),在語音識別中具有能量特征,與音頻之間的關(guān)系是非線性的,符合人類聽覺神經(jīng)的信號收發(fā)特點,識別率高[9]。語音特征處理分為濾波、樣本采集、格式變更、信號增大和語音分幀。單元匹配指加窗操作,加窗的作用是平滑語音相鄰幀之間的信號。設(shè)是窗函數(shù),是幀信號,為幀序列,則可表示加窗后的語音幀信號。窗函數(shù)有三種形態(tài),分別是矩形(Rectangular)、漢明(Hanming)和漢寧(Hanning),表示如下:

        式中為幀數(shù)量。

        在線連續(xù)交互式英語語音智能識別系統(tǒng)按照用戶英語語音特點自動選擇窗函數(shù)形態(tài)。

        詞性解碼與語法解析即為經(jīng)歷傅里葉變換的過程,可獲取到語音信號的頻率譜線,設(shè)是變換后的幀序列,有:

        設(shè)語音特征處理后的語音能量為經(jīng)余弦變換后得到語義解析結(jié)果:

        式(4)和式(5)給出的解析結(jié)果中存在一部分無用數(shù)據(jù),有用數(shù)據(jù)主要存在于的區(qū)間內(nèi),式(6)是刪除無用數(shù)據(jù)后的歸一化識別結(jié)果:

        式中是式(4)和式(5)的歸一化結(jié)果。

        3 實驗

        3.1 實驗介紹

        為了對在線連續(xù)交互式英語語音智能識別系統(tǒng)的有效性進行分析,本次實驗從標(biāo)準(zhǔn)的模式識別數(shù)據(jù)庫中提取語音訓(xùn)練集。訓(xùn)練集為“Continuous online interactive English speech intelligent recognition system is very good”,共11個英文單詞。

        實驗的語音采樣頻率為20 kHz;語音信號窗選擇24維漢明窗,長度是18 ms,分幀243點,幀移75點;語音特征參數(shù)的矢量量化為48碼,量化后生成一個42×70階的矩陣;11個單詞經(jīng)訓(xùn)練后都能輸出一個語音模型。

        圖4為實驗環(huán)境圖,為了防止安裝于手機或平板電腦上的英語語音智能識別系統(tǒng)受到手機硬件性能的限制無法發(fā)揮全部功能,統(tǒng)一在計算機上模擬高端手機硬件性能進行實驗。

        3.2 實驗結(jié)果及分析

        對訓(xùn)練集的11個單詞用本文系統(tǒng)、Audry系統(tǒng)、端點檢測系統(tǒng)和HMM系統(tǒng)分別進行實驗,實驗采用Matlab 6.5軟件進行整體管控、輸出實驗結(jié)果。對以上四個識別系統(tǒng)進行的一系列語音處理與識別過程進行參數(shù)提取,取得語音模型。進行5次訓(xùn)練,求得5次訓(xùn)練中語音模型的識別率平均值,實驗結(jié)果如表2所示。表3是四個系統(tǒng)語音識別時間平均值對比表。

        從表2中的數(shù)據(jù)可以看出,本文系統(tǒng)的語音識別率明顯高于端點檢測系統(tǒng)和HMM系統(tǒng),與Audry系統(tǒng)的語音識別率相差不大。由于表2中的實驗數(shù)據(jù)過多,不方便分析,對原始實驗結(jié)果的本文系統(tǒng)數(shù)據(jù)和Audry系統(tǒng)數(shù)據(jù)進行處理,合并單次訓(xùn)練中的語音識別率,求取平均值,將語音識別率的平均值描繪成折線圖,以便于分析,如圖5所示。為了增加對比結(jié)果的說服力,本文在繪制折線圖時縮小了縱坐標(biāo)的數(shù)值差距。

        從表3中可以看出,端點檢測系統(tǒng)的語音識別時間最長,Audry系統(tǒng)無明顯優(yōu)勢,本文系統(tǒng)和HMM系統(tǒng)的語音識別時間都很短,本文系統(tǒng)更勝一籌。

        從圖5中可以看出,本文系統(tǒng)的折線圖位置要比HMM系統(tǒng)的折線圖位置偏高一些,語音識別率更好一些。

        綜合分析語音識別率和語音識別時間的實驗結(jié)果可知,本文設(shè)計的在線連續(xù)交互式英語語音智能識別系統(tǒng)的語音識別率高且識別時間短,有效性強。

        4 結(jié) 論

        本文設(shè)計了在線連續(xù)交互式英語語音智能識別系統(tǒng),依次介紹了系統(tǒng)的工作流程、模塊資源和識別函數(shù)。實驗采用Matlab 6.5軟件驗證系統(tǒng)的有效性,對比了Audry系統(tǒng)、端點檢測系統(tǒng)和HMM系統(tǒng),對比結(jié)果表明,本文系統(tǒng)具備較強的有效性。

        參考文獻(xiàn)

        [1] 商雄偉,張志祥,邱舒婷.一種通用的限定領(lǐng)域智能語音導(dǎo)學(xué)系統(tǒng)設(shè)計方法[J].計算機工程,2016,42(6):299?304.

        [2] 胡丹,曾慶寧,龍超.調(diào)制域譜減法用于魯棒性語音識別[J].科學(xué)技術(shù)與工程,2016,16(4):216?220.

        [3] 馬英,陳超,張凌飛,等.感覺加權(quán)濾波在安多藏語特征提取中的應(yīng)用[J].科技通報,2016,32(8):207?209.

        [4] 劉榮輝,彭世國,劉國英.基于智能家居控制的嵌入式語音識別系統(tǒng)[J].廣東工業(yè)大學(xué)學(xué)報,2014,31(2):49?53.

        [5] 馬英,陳超,賈國慶.基于LPC的藏語語音基音周期的檢測分析[J].現(xiàn)代電子技術(shù),2015,38(16):13?15.

        [6] 劉增鎖,師勝利,王靜紅.基于交互的軟件模型研究[J].現(xiàn)代電子技術(shù),2016,39(15):119?122.

        [7] 周璐璐,鄧江洪.一種機器人智能語音識別算法研究[J].計算機測量與控制,2014,22(10):3267?3269.

        [8] 呂淘沙,湯汶,萬韜阮,等.增強現(xiàn)實交互技術(shù)在歷史博物館中的應(yīng)用[J].西安工程大學(xué)學(xué)報,2015,29(6):728?732.

        [9] 馬莎莎,戴曙光,穆平安.基于短時能量的循環(huán)AMDF基音檢測算法[J].計算機仿真,2014,31(7):278?282.

        猜你喜歡
        在線語音
        第二語言語音習(xí)得中的誤讀
        活力(2019年19期)2020-01-06 07:37:26
        魔力語音
        基于MATLAB的語音信號處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價廉物美的酒駕語音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        代表“在線”助力監(jiān)督
        浙江人大(2016年12期)2016-12-27 11:32:38
        綜合氣象業(yè)務(wù)在線培訓(xùn)考試系統(tǒng)設(shè)計
        在線檢測分析儀表的新型測量技術(shù)
        在線凝膠滲透色譜—氣相色譜—串聯(lián)質(zhì)譜聯(lián)用檢測煙葉中的農(nóng)藥殘留
        MOOC綜述與高校圖書館應(yīng)對策略
        科技視界(2015年25期)2015-09-01 17:10:31
        国产亚洲一区二区三区综合片| 九九热在线视频观看这里只有精品 | 国产av人人夜夜澡人人爽| 国产成人亚洲精品77| 国产人妖赵恩静在线视频| 亚洲精品一区二区三区新线路| 色中文字幕在线观看视频| 人妻少妇偷人精品无码| 国产精品久久婷婷六月丁香| 亚洲VR永久无码一区| 精品久久精品久久精品| 久久精品国产91精品亚洲| 中文字幕无码毛片免费看| 黄色成人网站免费无码av| 久久国产精品超级碰碰热| 亚洲乱码av中文一区二区第八页| 伊人中文字幕亚洲精品乱码| 国产午夜福利不卡在线观看| 国产亚洲精久久久久久无码77777| 91精品国产无码在线观看| av在线播放免费观看| 波多野结衣av一区二区全免费观看 | 亚洲国产一区二区三区精品| 国产午夜手机精彩视频| 在线播放无码高潮的视频| 免费大学生国产在线观看p| 国产成人av三级三级三级在线| 欧美国产激情18| 夜先锋av资源网站| 二区久久国产乱子伦免费精品| 蜜桃av一区二区三区 | 4hu四虎永久免费地址ww416| 久久久久亚洲精品无码网址色欲| 999久久66久6只有精品| 自拍av免费在线观看| 久久精品国产亚洲超碰av| 久久精品噜噜噜成人| 久久中国国产Av秘 入口| 日韩日本国产一区二区| www国产亚洲精品| 东北寡妇特级毛片免费|