魏海龍 張劍 陳俊 張智
【摘 要】針對地空通話系統(tǒng)中麥克風(fēng)、音量控制及音頻信號等識別精度受環(huán)境噪聲影響問題,提出了語音文字轉(zhuǎn)換輔助系統(tǒng)的設(shè)計,以51單片機、語音模塊、液晶顯示器等模塊組成,實現(xiàn)語音播放和文字顯示以增強民航地空通信中的信息交流。
【關(guān)鍵詞】地空通信;語音識別;LD3320語音模塊;文字顯示
中圖分類號: TN92;V243.1;V351.36文獻標(biāo)識碼: A文章編號: 2095-2457(2019)04-0116-002
DOI:10.19694/j.cnki.issn2095-2457.2019.04.046
Design of Auxiliary conversion system for speech-text in radiotelephony communication of Civil Aviation
WEI Hai-long ZHANG Jian CHEN Jun ZHANG Zhi
(School of Air Transport, Shanghai University of Engineering and Technology, Shanghai 201620, China)
【Abstract】the recognition accuracy of microphone, volume control and audio signal in aeronautical speech system is affected by ambient noise. This paper puts forward the design of the Auxiliary system of speech and text conversion, which is composed of LD3320 speech module, SD card interface, touch display module and so on, which is controlled by 51 single chip microcomputer system. Voice playback and text display are implemented to enhance the communication between civil aviation and air-to-air communications.
【Key words】Radiotelephony communication; Speech Recognition; LD3320 speech module; Text display
0 引言
目前民航地空語音通信主要是利用HF、VHF技術(shù)[1],飛行員在語音通信時,在多語言環(huán)境以及飛行員所承受的巨大壓力下導(dǎo)致遺忘部分信息,甚至可能存在口音問題導(dǎo)致理解錯誤,因此通過語音文字轉(zhuǎn)換輔助系統(tǒng)將語言轉(zhuǎn)換成文字顯示出來,方便機組人員理解查找,避免遺忘,將增強民航地空通信的信息交流的可靠性,有利于民航飛行的安全。
語音識別系統(tǒng)是建立在語音技術(shù)、信號處理、模式識別等學(xué)科的數(shù)學(xué)模型基礎(chǔ)上,運用不同的計算機算法來實現(xiàn)的,可促進和改善人與人,人與機器之間的信息交流[2]。本文語音文字轉(zhuǎn)換輔助系統(tǒng)設(shè)計以51單片機系統(tǒng)作為核心控制,由LD3320語音模塊進行語音識別處理、SD卡接口、液晶顯示器等模塊組成,實現(xiàn)語音的播放與文字的顯示以加強民航地空通信信息的交流。
1 系統(tǒng)總體框圖
根據(jù)目前航空語音系統(tǒng)中麥克風(fēng)、音量控制及音頻信號等識別精度受環(huán)境噪聲影響問題,以及受應(yīng)用環(huán)境的影響。本文設(shè)計出語音文字轉(zhuǎn)換輔助系統(tǒng)。該系統(tǒng)設(shè)計采用51單片機作為核心控制處理,由LD3320語音模塊進行語音識別處理,外加SD卡存儲飛行員通信專用術(shù)語,由液晶顯示屏顯示語音識別出的文字。其基本結(jié)構(gòu)框圖如圖1所示。
2 系統(tǒng)模塊原型設(shè)計
2.1 語音識別模塊
語音識別中主要有非特定人語音識別和特定語音識別兩種技術(shù),非特定人語音識別技術(shù)側(cè)重提取能夠表征語義的特征參數(shù),忽略語音所包含的個體信息;特定人語音識別技術(shù)不僅提取能夠表征語義的特征參數(shù),也會提取語音所包含的個體信息[4]。
基于統(tǒng)計特征的非特定人語音識別系統(tǒng)可大致分為三部分:
(1)語音信號預(yù)處理與特征提?。簽V除與語音識別無關(guān)的信息,提取語音識別的重要特征信息。
(2)聲學(xué)模型與模式匹配:利用訓(xùn)練算法對語音特征進行處理生成聲學(xué)模型,語音識別時首先提取語音特征,然后與已生成的聲學(xué)模型進行模式匹配得到識別結(jié)果。聲學(xué)模型是語音識別系統(tǒng)的核心部分,其設(shè)計單元、識別統(tǒng)詞匯量、訓(xùn)練數(shù)據(jù)量、識別率和語音應(yīng)用環(huán)境特點密切相關(guān)。
(3)語言模型處理:通過語言模型對所識別出的語音模型語進行語法、語義分析[5]。
本系統(tǒng)采用基于非特定語音識別技術(shù),語音識別模塊主要采用LD3320芯片,語音識別電路設(shè)計圖如圖2所示。該芯片基于非特定人語音識別(SI-ASR:Speak-Independent Automatic Speech Recognition)技術(shù)的語音識別和聲控芯片,內(nèi)置非特定人語音識別算法,并且集成了語音識別處理器以及部分外部電路[3],識別詞語條目支持動態(tài)編輯,可滿足基本的航空陸空通話專用術(shù)語模式的應(yīng)用需求。
2.2 控制及輔助模塊
(1)控制模塊:采用STC89c51單片機作為系統(tǒng)主控制芯片,片上資源比較豐富,可利用的I/O口較多,處理速度能滿足該系統(tǒng)要求。
對語音識別芯片的設(shè)置和數(shù)據(jù)傳送主要通過對寄存器的操作來實現(xiàn)[6]。進行語音識別時,通過預(yù)先設(shè)置的識別關(guān)鍵詞語列表,設(shè)定芯片的識別模式,LD3320識別完成后,識別結(jié)果通過寄存器返回識別出的關(guān)鍵詞語在預(yù)先設(shè)置好的關(guān)鍵詞語列表中排列索引值index。
(2)文字顯示模塊:采用9648液晶屏,顯示LD3320芯片識別出的語音內(nèi)容。
(3)電源模塊:利用三端穩(wěn)壓集成電路LM7805為語音識別系統(tǒng)提供5V直流電源,語音芯片LD3320的工作電壓為3.3V,利用LM1117-3.3芯片實現(xiàn)5V-3.3V電壓轉(zhuǎn)換為LD3320供電。
3 結(jié)束語
本文結(jié)合實際情況,從語音轉(zhuǎn)換的實際意義出發(fā),結(jié)合自身條件以及利用現(xiàn)有技術(shù),設(shè)計了語音文字轉(zhuǎn)換系統(tǒng),通過單片機控制LD3320語音模塊,以及液晶顯示模塊,實現(xiàn)語音播放及文字顯示。本語音文字轉(zhuǎn)換輔助系統(tǒng)的設(shè)計通過將信息以文字的方式呈現(xiàn),增強民航地空通信中的信息交流。使民航工作更為安全穩(wěn)定。
【參考文獻】
[1]周偉康.淺談民航地空通信技術(shù)的發(fā)展[J].信息系統(tǒng)工程,2014(08):24.
[2]方紅峰,馮嘉禮,韋夢蕓,劉永昌.英語語音轉(zhuǎn)換英文文字的軟件實現(xiàn)[J].哈爾濱工程大學(xué)報,2006(07):584-586.
[3]陳喜春.基于LD3320語音識別專用芯片實現(xiàn)的語音控制[J].電子技術(shù)設(shè)計與應(yīng)用,2011(11):20-21.
[4]郭昕.基于HMM和匹配追蹤的多參數(shù)語音控制[J].科研發(fā)展,2013(09):92-93.
[5]趙力.語音信號處理[M].第2版.北京.機械工業(yè)出版社,2009,233-234.
[6]ICRoute Ltd..LD3320數(shù)據(jù)手冊[EB/OL].http://www.icroute.com/web_cn/ DownLoad.html.