溫玉華
摘? 要: 為了提高英語發(fā)音錯誤自動校正系統(tǒng)的校正準(zhǔn)確度,提出基于DTW算法的英語發(fā)音錯誤自動校正系統(tǒng)設(shè)計。依托語音識別傳感器優(yōu)化設(shè)計和發(fā)音識別處理器改進設(shè)計,完成系統(tǒng)的硬件設(shè)計;基于英語發(fā)音采集程序設(shè)計和提取英語發(fā)音錯誤信號參數(shù),完成系統(tǒng)的軟件設(shè)計。在DTW算法基礎(chǔ)上,實現(xiàn)了英語發(fā)音錯誤自動校正系統(tǒng)設(shè)計。測試結(jié)果表明,基于DTW算法的英語發(fā)音錯誤自動校正系統(tǒng)相比于傳統(tǒng)校正系統(tǒng),英語發(fā)音校正的準(zhǔn)確率提升了36.53%。
關(guān)鍵詞: 自動校正; 英語發(fā)音; 系統(tǒng)設(shè)計; DTW算法; 程序設(shè)計; 系統(tǒng)測試
中圖分類號: TN912.34?34? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼: A? ? ? ? ? ? ? ? ? ? ?文章編號: 1004?373X(2020)10?0124?03
Design of DTW algorithm based automatic correction system for
English pronunciation mistakes
WEN Yuhua
(Inner Mongolia Agricultural University, Hohhot 010019, China)
Abstract: A design of DTW algorithm based automatic correction system for English pronunciation mistakes is proposed to improve the calibration accuracy of the automatic correction system for English pronunciation mistakes. The hardware design of the system is completed based on the optimized design of speech recognition sensor and the improved design of pronunciation recognition processor. The software design of the system is completed based on the design of English pronunciation collection program and the extraction of English pronunciation mistake signal parameters. The design of automatic correction system for English pronunciation errors is realized based on DTW algorithm. The testing results show that the English pronunciation correction accuracy of the DTW algorithm based automatic correction system for English pronunciation mistake is 36.53% higher than that of the traditional correction system.
Keywords: automatic correction; English pronunciation; system design; DTW algorithm; program design; system testing
隨著對計算機語音識別系統(tǒng)需求的提高,發(fā)音錯誤自動校正系統(tǒng)的研究也越來越受到人們的重視[1?3]。針對傳統(tǒng)英語發(fā)音錯誤自動校正系統(tǒng)存在的其他數(shù)據(jù)信息干擾、多種語音混淆、雜音無法徹底消除、語音識別混亂等問題,本文將DTW算法應(yīng)用到英語發(fā)音錯誤自動校正系統(tǒng)設(shè)計中對英語發(fā)音進行在線語音識別,將一些常用詞匯語音識別應(yīng)用在特定的環(huán)境中,解決人們生活中的難題。
1? 英語發(fā)音錯誤自動校正系統(tǒng)硬件設(shè)計
1.1? 語音識別傳感器優(yōu)化設(shè)計
語音識別傳感器是利用二極管完成語音識別,將英語發(fā)音轉(zhuǎn)換成數(shù)字信號。目前應(yīng)用最廣泛的語音識別傳感器是CMOS傳感器和CCD傳感器。CMOS傳感器中每一個二級管都會連接一個識別器和轉(zhuǎn)換電路,采用類似內(nèi)存電路的方式將識別到的英語發(fā)音輸出[4];而CCD傳感器優(yōu)化了CMOS傳感器的內(nèi)部結(jié)構(gòu),只有一個識別器[5],每一個二極管的英語發(fā)音數(shù)據(jù)都會一次傳到下一個單元中,經(jīng)傳感器最底端的部分整合后輸出,最后經(jīng)過傳感器末端的識別器,識別成功后輸出[6]。
1.2? 發(fā)音識別處理器改進設(shè)計
本文發(fā)音識別處理器在原優(yōu)化基礎(chǔ)上進行改進設(shè)計,根據(jù)DTW算法完成英語發(fā)音的分析與識別,它強調(diào)的是英語語音處理的實時性。因此發(fā)音識別處理器除了具有普通處理器的控制功能和高速運算外,還針對實時英語發(fā)音處理的要求,改進了處理器機構(gòu)、指令系統(tǒng)和流程,提高了校正的準(zhǔn)確度[7]。DSP芯片的選擇對發(fā)音識別處理器的改進設(shè)計也非常重要,不僅關(guān)系到英語發(fā)音的處理速度,還牽涉到處理器的改進難度和進程。
發(fā)音識別處理器的改進要考慮芯片的處理速度和識別精度,對于一個自動英語發(fā)音系統(tǒng)來講,發(fā)音識別的處理速度是最重要的,必須要求處理器在限定的時間內(nèi)完成相應(yīng)的處理任務(wù),否則就很難保證英語發(fā)音處理的實時性。發(fā)音識別處理器在設(shè)計時,根據(jù)DTW算法以及處理的時間要求來決定處理器芯片的識別速度。一般情況下,浮點DSP芯片的英語發(fā)音識別精度要高于定點DSP芯片的英語發(fā)音識別精度,在英語發(fā)音錯誤自動校正方面具有較高的校正準(zhǔn)確率[8]。處理器芯片的內(nèi)部結(jié)構(gòu)圖如圖1所示。
基于英語發(fā)音錯誤自動校正的處理器芯片主要針對數(shù)據(jù)處理速度快、硬件資源廣的特點,選擇滿足英語發(fā)音數(shù)據(jù)處理的處理器芯片。英語發(fā)音錯誤自動校正系統(tǒng)的大量運算就是英語發(fā)音錯誤的數(shù)據(jù)處理,因此考慮處理速度因素后,決定選擇TDSP?TF887作為處理器芯片的選擇方案[9]。發(fā)音識別處理器架構(gòu)是基于最佳代碼密度而設(shè)計的一種混合16/32位指令級架構(gòu),這種架構(gòu)適合于復(fù)雜英語發(fā)音錯誤數(shù)據(jù)的處理能力,可以提高英語發(fā)音錯誤自動校正的準(zhǔn)確率。
以上針對原始語音識別傳感器的缺點,優(yōu)化設(shè)計了傳感器的內(nèi)部結(jié)構(gòu),完成了語音識別傳感器的優(yōu)化設(shè)計;又結(jié)合英語語音實時處理的要求,選擇合適的處理器芯片,加快識別的速度和精度,完成發(fā)音識別處理的改進設(shè)計,從而實現(xiàn)了系統(tǒng)的硬件設(shè)計。
2? 英語發(fā)音錯誤自動校正系統(tǒng)軟件設(shè)計
2.1? 英語發(fā)音采集程序設(shè)計
英語發(fā)音錯誤信號采集是英語發(fā)音錯誤自動矯正系統(tǒng)的第一個過程,該采集程序可以自動搜索出發(fā)音錯誤的語音信號,不僅提高了英語發(fā)音錯誤的校正效率,還提高了校正的精準(zhǔn)度。如果程序中沒有語音設(shè)備,系統(tǒng)就會顯示參數(shù)錯誤[10]。所以在程序運行前安裝語音設(shè)備在安裝語音設(shè)備的基礎(chǔ)上,將英語發(fā)音錯誤信號參數(shù)初始化,確保接收到的英語發(fā)音是系統(tǒng)支持的格式。為識別到的英語發(fā)音緩沖區(qū)分配儲存空間,開始計算錯誤信號參數(shù),最后停止信號采集[11?12]。英語發(fā)音采集程序運行流程如圖2所示。
2.2? 提取英語發(fā)音錯誤信號參數(shù)
如何提取發(fā)音錯誤信號,以及提取的參數(shù)內(nèi)容,都會影響系統(tǒng)的校正準(zhǔn)確度[13]。提取英語發(fā)音錯誤信號參數(shù)得到有價值的英語發(fā)音錯誤信息,從而可以確保校正的準(zhǔn)確度。具體提取步驟如下:
1) 首先將采集到的英語發(fā)音錯誤信號進行預(yù)加重、分幀、加窗處理,其中英語發(fā)音錯誤信號的采樣點數(shù)為256,之后對其進行傅里葉變換得到錯誤信號的頻譜。
2) 求英語發(fā)音錯誤信號的功率譜。
3) 將求得的功率譜進行梅爾濾波器運算,得到一個運算結(jié)果,將結(jié)果取對數(shù)得到一個對數(shù)頻譜。
4) 將得到的對數(shù)頻譜進行由時域到頻域的變化,用于錯誤信號的離散余弦變換[14],公式如下:
[Cn=Smcosπnm+0.5M] (1)
式中:[Sm]表示對數(shù)頻譜;[cosπnm+0.5M]為錯誤信號的離散余弦變換。
5) 將每一幀發(fā)音錯誤信號都采用上述特征提取,得到一個最有價值的英語發(fā)音錯誤信號。
英語發(fā)音錯誤信號的提取可以通過計算錯誤信號的功率譜,實現(xiàn)英語發(fā)音錯誤的自動校正,降低計算復(fù)雜程度的同時,也提高了英語發(fā)音錯誤的校正準(zhǔn)確率[15]。綜上所述,依托語音識別傳感器優(yōu)化設(shè)計和發(fā)音識別處理器改進設(shè)計,完成了系統(tǒng)的硬件設(shè)計;基于英語發(fā)音采集程序設(shè)計和提取英語發(fā)音錯誤信號參數(shù),完成了系統(tǒng)的軟件設(shè)計,在DTW算法基礎(chǔ)上,實現(xiàn)了英語發(fā)音錯誤自動校正系統(tǒng)設(shè)計。
3? 系統(tǒng)測試
3.1? 設(shè)定實驗參數(shù)
為了驗證基于DTW算法的英語發(fā)音錯誤自動校正系統(tǒng)對英語發(fā)音錯誤校正的準(zhǔn)確度,選擇牛津大學(xué)出版社的英語詞典,里面包含23 156個詞語,包括32篇英語發(fā)音適讀文章和18篇測試資料。設(shè)置如下參數(shù):英語發(fā)音的振動音頻在[-100,100]之間;衡量英語發(fā)音的有效參數(shù)[wn=11]為8.5;[max X]的極限值分別為3.2,3.6,4.0,4.2。
3.2? 構(gòu)建英語發(fā)音數(shù)據(jù)庫
英語發(fā)音數(shù)據(jù)庫是校正系統(tǒng)的輸入內(nèi)容,包括標(biāo)準(zhǔn)發(fā)音數(shù)據(jù)庫、詞典數(shù)據(jù)庫和待測語音庫。詞典數(shù)據(jù)庫采用BEEP數(shù)據(jù)庫,將英語發(fā)音數(shù)據(jù)庫設(shè)置成開放式,所有人均可提交英語發(fā)音內(nèi)容并擴展。
為了評價基于DTW算法的英語發(fā)音錯誤自動校正系統(tǒng)的校正準(zhǔn)確度,引入準(zhǔn)確率和召回率來衡量英語發(fā)音錯誤自動校正的準(zhǔn)確度,準(zhǔn)確率和召回率公式如下:
[準(zhǔn)確率=查找出真正錯誤的個數(shù)查找到英語發(fā)音錯誤總數(shù)×100%]? (2)
[召回率=查找出真正錯誤的個數(shù)待校正英語發(fā)音中的錯誤個數(shù)×100%] (3)
3.3? 實驗結(jié)果
利用上述指標(biāo),在英語發(fā)音數(shù)據(jù)庫中完成系統(tǒng)測試實驗,結(jié)果如圖3所示。從圖3可以看出,傳統(tǒng)校正系統(tǒng)對英語發(fā)音錯誤的校正準(zhǔn)確率和召回率都很低,英語發(fā)音錯誤自動校正的準(zhǔn)確率最高只有62.6%,10次測試結(jié)果中,英語發(fā)音錯誤自動校正準(zhǔn)確率的平均值為59.02%;而采用基于DTW算法的英語發(fā)音錯誤自動校正系統(tǒng)對英語發(fā)音錯誤的校正準(zhǔn)確率和召回率基本上都超過了90%,準(zhǔn)確率最高達(dá)到了96.3%,10次測試結(jié)果中,英語發(fā)音錯誤自動校正準(zhǔn)確率的平均值為92.99%。因此,可以得出基于DTW算法的英語發(fā)音錯誤自動校正系統(tǒng)可以提高英語發(fā)音錯誤校正的準(zhǔn)確度。
4? 結(jié)? 語
本文提出基于DTW算法的英語發(fā)音錯誤自動校正系統(tǒng)設(shè)計。在完成硬件設(shè)計和軟件設(shè)計后,實現(xiàn)了基于DTW算法的校正系統(tǒng)設(shè)計。測試結(jié)果表明,該系統(tǒng)相比于傳統(tǒng)校正系統(tǒng)英語發(fā)音校正的準(zhǔn)確率提升了36.53%。
參考文獻(xiàn)
[1] 王興剛.英文發(fā)音中錯誤語音自動識別系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2018,41(10):179?182.
[2] 李春蘭.英語口語自動發(fā)音校對系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2017,40(24):59?61.
[3] 趙丹,鐘楠.在線連續(xù)交互式英語語音智能識別系統(tǒng)設(shè)計[J].現(xiàn)代電子技術(shù),2017,40(15):137?140.
[4] 田林,盛風(fēng)濤,黃天姿.基于4?氨基吖啶酮小分子傳感器的設(shè)計、合成及識別性能研究[J].化學(xué)試劑,2017,39(4):405?408.
[5] 李林,魏新華,毛罕平.冬油菜田雜草探測光譜傳感器設(shè)計與應(yīng)用[J].農(nóng)業(yè)工程學(xué)報,2017,33(18):127?133.
[6] 李智,滕科嘉,李銳華.液氧煤油發(fā)動機地面試驗低溫壓力傳感器校準(zhǔn)系統(tǒng)設(shè)計[J].低溫工程,2017,11(6):56?62.
[7] 李功麗,戴紫彬.基于流體系架構(gòu)的分組密碼處理器設(shè)計[J].計算機研究與發(fā)展,2017,54(12):2824?2833.
[8] 王旭,付家為,何虎.混合架構(gòu)通用數(shù)字信號處理器設(shè)計[J].計算機工程與設(shè)計,2017,38(1):70?74.
[9] 陳黎明,陳鋮穎,楊駿.用于智能傳聲器的低功耗語音降噪處理器設(shè)計[J].上海交通大學(xué)學(xué)報,2018,52(9):1098?1103.
[10] 李明凱,劉鐵軍,周民.基于USB及CPLD的超聲信號采集器設(shè)計及應(yīng)用[J].儀表技術(shù)與傳感器,2018(5):86?90.
[11] 楊紅莉,曾憲陽,郁漢琪.高速攝像頭數(shù)據(jù)采集系統(tǒng)設(shè)計及算法研究[J].電子器件,2017,40(5):1161?1166.
[12] 苗海林,殷楠,李玉峰.多火災(zāi)危險特征信息采集系統(tǒng)設(shè)計[J].船海工程,2018,47(6):108?110.
[13] 朱普茂,章鵬,丁頻一.馬丁代克深度輪誤差校正系統(tǒng)設(shè)計[J].傳感技術(shù)學(xué)報,2017(6):867?871.
[14] 李維凱,張瑋,殷達(dá)鈺.CSRm束流累積階段閉軌校正系統(tǒng)設(shè)計[J].強激光與粒子束,2019,31(3):64?68.
[15] 沈凱,姚志成,何岷.彈載相控陣?yán)走_(dá)近場校準(zhǔn)系統(tǒng)設(shè)計研究[J].計算機仿真,2018,35(8):11?14.