趙崇里 李利正
摘 要:文章介紹了基于語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)的商務(wù)英語(yǔ)移動(dòng)學(xué)習(xí)平臺(tái)設(shè)計(jì)技術(shù)。闡述了平臺(tái)開(kāi)發(fā)的背景,提出了平臺(tái)開(kāi)發(fā)的技術(shù)路線(xiàn)、功能結(jié)構(gòu)和關(guān)鍵技術(shù),結(jié)合商務(wù)英語(yǔ)專(zhuān)業(yè)教師提供的教學(xué)資料,平臺(tái)在本校商務(wù)英語(yǔ)專(zhuān)業(yè)中測(cè)試通過(guò),為學(xué)生利用課外零碎時(shí)間學(xué)習(xí)商務(wù)英語(yǔ)提供了方便和有效的工具,豐富了學(xué)生的學(xué)習(xí)資源。
關(guān)鍵詞:語(yǔ)音合成;語(yǔ)音識(shí)別;移動(dòng)學(xué)習(xí)平臺(tái)
隨著全球化趨勢(shì)的發(fā)展,英語(yǔ)作為一種交流工具扮演著越來(lái)越重要的角色。商務(wù)英語(yǔ)是以適應(yīng)職場(chǎng)生活的語(yǔ)言要求為目的一種專(zhuān)業(yè)性語(yǔ)言,需要掌握的核心技能包括口語(yǔ)交流和函件閱讀、撰寫(xiě)。對(duì)于如何提高商務(wù)英語(yǔ)的學(xué)習(xí)效果和應(yīng)用能力,已經(jīng)成為廣大英語(yǔ)教育工作者和從事外貿(mào)工作的職員所關(guān)注的重要問(wèn)題。移動(dòng)學(xué)習(xí)作為一種新型學(xué)習(xí)方式,能夠有效利用時(shí)空資源實(shí)現(xiàn)高效學(xué)習(xí),正受到越來(lái)越多的關(guān)注。商務(wù)英語(yǔ)移動(dòng)學(xué)習(xí)平臺(tái)不失為是一種幫助學(xué)習(xí)者提高商務(wù)英語(yǔ)學(xué)習(xí)效率的有效手段。目前市場(chǎng)上基于計(jì)算機(jī)的英語(yǔ)智能學(xué)習(xí)軟件很多,通過(guò)計(jì)算機(jī)輔助學(xué)習(xí)技術(shù),系統(tǒng)的給出學(xué)習(xí)計(jì)劃,生成單詞發(fā)音、基于情境的對(duì)話(huà),基于特征提取、模式匹配及時(shí)得到發(fā)音質(zhì)量評(píng)分的智能化功能。然而受移動(dòng)設(shè)備運(yùn)算速度、存儲(chǔ)空間和總線(xiàn)帶寬等因素的限制,很難將此類(lèi)軟件移植到手機(jī)平臺(tái)。因此,需要根據(jù)商務(wù)英語(yǔ)的特點(diǎn),綜合利用Android設(shè)備的優(yōu)勢(shì)和Google TTS和百度語(yǔ)音識(shí)別技術(shù)的開(kāi)源應(yīng)用等各種先進(jìn)技術(shù),對(duì)商務(wù)英語(yǔ)移動(dòng)學(xué)習(xí)平臺(tái)進(jìn)行功能設(shè)計(jì)和軟件開(kāi)發(fā)。文章對(duì)基于TTS、百度語(yǔ)音識(shí)別的商務(wù)英語(yǔ)移動(dòng)學(xué)習(xí)軟件平臺(tái)的設(shè)計(jì)進(jìn)行了研究,意在為廣大商務(wù)英語(yǔ)學(xué)習(xí)者、應(yīng)用者提供一個(gè)不受時(shí)空限制的商務(wù)英語(yǔ)學(xué)習(xí)平臺(tái)。
1 語(yǔ)音技術(shù)
語(yǔ)音合成和語(yǔ)音識(shí)別技術(shù)是實(shí)現(xiàn)人機(jī)語(yǔ)音通信,建立具有聽(tīng)和講功能的口語(yǔ)系統(tǒng)所必需的兩項(xiàng)關(guān)鍵技術(shù)[1]。
Text To Speech(簡(jiǎn)稱(chēng)TTS),從文本到語(yǔ)音所使用的關(guān)鍵技術(shù)就是語(yǔ)音合成技術(shù),能將文字信息轉(zhuǎn)變?yōu)榭梢月?tīng)懂的、流利的語(yǔ)音輸出技術(shù)。早期的TTS一般采用專(zhuān)業(yè)的芯片實(shí)現(xiàn),在語(yǔ)音處理專(zhuān)家的努力下,目前已日益成熟,合成效果越來(lái)越接近于自然語(yǔ)境[2]。
語(yǔ)音識(shí)別(Speech Recognition),是通過(guò)計(jì)算機(jī)將人類(lèi)語(yǔ)音信號(hào)轉(zhuǎn)換為文本序列的過(guò)程。語(yǔ)音識(shí)別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三個(gè)方面[3],涉及信號(hào)處理、模式識(shí)別、概率論和信息論、發(fā)聲機(jī)理、聽(tīng)覺(jué)機(jī)理、人工智能等領(lǐng)域,是一門(mén)非常復(fù)雜的交叉學(xué)科。
2 項(xiàng)目背景
利用隨身攜帶的移動(dòng)設(shè)備安裝英語(yǔ)學(xué)習(xí)軟件就可以?huà)仐壓裰刭Y料、利用碎片時(shí)間學(xué)習(xí)英語(yǔ)。英語(yǔ)的移動(dòng)學(xué)習(xí)軟件市場(chǎng)研究較早,應(yīng)用也甚廣。這些移動(dòng)學(xué)習(xí)軟件中,有些詞匯量龐大,像我愛(ài)背單詞、超級(jí)英語(yǔ)詞典等;有些教材比較系統(tǒng)和完整,無(wú)論處在哪個(gè)英語(yǔ)學(xué)習(xí)階段,都可以從新概念英語(yǔ)中找到相應(yīng)的教材,并且功能豐富,幫助學(xué)習(xí)者很好地學(xué)習(xí)和記憶單詞或是英語(yǔ)語(yǔ)法;有些通過(guò)英文原聲電影寓教于樂(lè)形式輕松地記住一些日常單詞和口語(yǔ)的用法。這些軟件功能齊全,但是在商務(wù)英語(yǔ)教育、學(xué)習(xí)方面,缺少系統(tǒng)的編排。而現(xiàn)有的商務(wù)英文口語(yǔ)900句等軟件又缺少中英文互譯或者不支持發(fā)音功能。因此開(kāi)發(fā)一個(gè)支持中英文互譯、又具備發(fā)音功能的免費(fèi)簡(jiǎn)易商務(wù)英語(yǔ)學(xué)習(xí)軟件是非常有意義的。
3 移動(dòng)學(xué)習(xí)平臺(tái)功能分析及其設(shè)計(jì)
移動(dòng)學(xué)習(xí)平臺(tái)的設(shè)計(jì)應(yīng)考慮到移動(dòng)學(xué)習(xí)所具有的四個(gè)特性,即:學(xué)習(xí)便捷性、知識(shí)導(dǎo)航性、情境相關(guān)性、交互便捷性[4]。針對(duì)以上特性,總結(jié)現(xiàn)有英語(yǔ)學(xué)習(xí)軟件的優(yōu)點(diǎn),本平臺(tái)設(shè)計(jì)了商務(wù)情境,提供了商務(wù)情境下的學(xué)習(xí)內(nèi)容。
3.1 技術(shù)路線(xiàn)
⑴平臺(tái)采用C/S架構(gòu),客戶(hù)端程序運(yùn)行在A(yíng)ndroid移動(dòng)設(shè)備上,服務(wù)器端程序運(yùn)行在服務(wù)器上。
⑵客戶(hù)端與服務(wù)器端交互采用Http協(xié)議進(jìn)行數(shù)據(jù)通信,服務(wù)器端在收到客戶(hù)端請(qǐng)求后,以XML文件格式發(fā)送數(shù)據(jù)到客戶(hù)端。
⑶數(shù)據(jù)存儲(chǔ)上采用本地?cái)?shù)據(jù)和服務(wù)器數(shù)據(jù)兩者結(jié)合,既能提高數(shù)據(jù)存儲(chǔ)容量,又能加快軟件運(yùn)行速度。
3.2 應(yīng)用系統(tǒng)搭建
基于TTS和百度語(yǔ)音識(shí)別技術(shù),構(gòu)建應(yīng)用系統(tǒng),如圖1所示。
⑴自學(xué)模塊:包括計(jì)劃學(xué)習(xí)和隨機(jī)學(xué)習(xí)兩種模式。計(jì)劃學(xué)習(xí)按系統(tǒng)編排進(jìn)行商務(wù)單詞學(xué)習(xí)、商務(wù)短句學(xué)習(xí)、情境對(duì)話(huà)學(xué)習(xí)、商務(wù)函件學(xué)習(xí)等。隨機(jī)學(xué)習(xí)模式是根據(jù)學(xué)習(xí)者提交的知識(shí)范圍系統(tǒng)隨機(jī)抽取學(xué)習(xí)庫(kù)中文件進(jìn)行學(xué)習(xí)。學(xué)習(xí)者開(kāi)始學(xué)習(xí)后,平臺(tái)會(huì)在展示文本的同時(shí)根據(jù)學(xué)習(xí)者意愿播放語(yǔ)音,讓學(xué)習(xí)者跟讀。
⑵成績(jī)測(cè)試模塊:對(duì)自學(xué)模塊的單詞、短句、商務(wù)函件等模塊知識(shí)進(jìn)行測(cè)試,并給出相應(yīng)得分,幫學(xué)習(xí)者查漏補(bǔ)缺。
⑶中英文互譯:借助google translate和tts技術(shù)實(shí)現(xiàn)中英文互譯、朗讀。在學(xué)習(xí)者碰到生詞、僻詞可以進(jìn)行中英文轉(zhuǎn)譯,并給出英文發(fā)音,讓學(xué)習(xí)者在記住單詞意思的同時(shí),能正確發(fā)音。
4 關(guān)鍵技術(shù)
4.1 語(yǔ)音合成技術(shù)
TTS是Android從1.6版本開(kāi)始支持的新功能,需要由TTS Engine的支持,系統(tǒng)默認(rèn)的TTS引擎是Pico TTS,該引擎支持English、French、German、Italian和Spanish,但是不支持中文,因此本文引入第三方開(kāi)源引擎eSpeak。
TTS提供了兩個(gè)接口和兩個(gè)類(lèi)來(lái)實(shí)現(xiàn)語(yǔ)音合成功能,具體步驟如下:
⑴[5]通過(guò)新建Intent檢查移動(dòng)設(shè)備是否安裝或缺少TTS語(yǔ)言數(shù)據(jù),并根據(jù)返回結(jié)果進(jìn)行處理,若檢查成功創(chuàng)建一個(gè)TextToSpeech對(duì)象,若失敗則需要下載TTS數(shù)據(jù),關(guān)鍵代碼如下:
Public void onCreate(){
…
Intent intent = new Intent();
intent.setAction(TextToSpeech.Engine.ACTION_CHECK_TTS_DATA);
startActivityForResult(checkIntent,REQ_TTS_STATUS_CHECK);
…
}
protected void onActivityResult(int requestCode,int resultCode,Intent data){
…
Case TextToSpeech.Engine.CHECK_VOICE_DATA_PASS:
mTts = new TextToSpeech(this,this);
…
}
⑵當(dāng)TTS引擎檢測(cè)到新生成TextToSpeech對(duì)象,就會(huì)調(diào)用OnInitListener接口中定義的回調(diào)函數(shù)onInit(),該函數(shù)里若檢測(cè)到TTS引擎初始化成功,用TTS的setLanguage()方法設(shè)置語(yǔ)言,speak()方法進(jìn)行文語(yǔ)轉(zhuǎn)換。
4.2 語(yǔ)言識(shí)別技術(shù)
語(yǔ)音識(shí)別是以語(yǔ)音為研究對(duì)象,通過(guò)特征提取、模式識(shí)別技術(shù)讓設(shè)備聽(tīng)懂人類(lèi)發(fā)出的語(yǔ)言,并轉(zhuǎn)換為文本的一種高技術(shù)。目前語(yǔ)音識(shí)別的方法主要有隱馬爾科夫模型(HMM)、動(dòng)態(tài)時(shí)間規(guī)整技術(shù)(DTW)、矢量量化(VQ)等[6],本文主要利用百度語(yǔ)音識(shí)別SDK提供的API接口實(shí)現(xiàn)人機(jī)口語(yǔ)交互。
百度語(yǔ)音識(shí)別API關(guān)鍵類(lèi)是Voice Recognitiion Client,該類(lèi)提供了speakFinish()、startVoiceRecognition()和stopVoiceRecognition()方法分別用來(lái)控制語(yǔ)音輸入結(jié)束、語(yǔ)音識(shí)別開(kāi)始和語(yǔ)音識(shí)別結(jié)束。首先在主程序中實(shí)例化該類(lèi),在接收語(yǔ)音輸入前通過(guò)VoiceRecognitionConfig類(lèi)設(shè)置識(shí)別類(lèi)型,開(kāi)啟語(yǔ)義解析,設(shè)置識(shí)別開(kāi)始提示音、識(shí)別結(jié)束提示音和采樣率,并由VoiceRecognitionClient類(lèi)的startVoiceRecognition方法發(fā)起語(yǔ)音識(shí)別,語(yǔ)音識(shí)別回調(diào)接口VoiceClientStatusChangeListener根據(jù)語(yǔ)音識(shí)別過(guò)程中不同的狀態(tài)做出不同的反饋,當(dāng)檢測(cè)到VoiceRecognitionClient.CLIENT_STATUS_FINISH即語(yǔ)音識(shí)別完成,則通過(guò)UpdateRecognitionResult方法將識(shí)別內(nèi)容顯示,本文是通過(guò)Android自帶的Google Translate進(jìn)行中英文互譯。
5 結(jié)語(yǔ)
文章結(jié)合如何設(shè)計(jì)一個(gè)基于語(yǔ)音識(shí)別和語(yǔ)音合成技術(shù)的移動(dòng)商務(wù)英語(yǔ)學(xué)習(xí)平臺(tái),詳細(xì)闡明了平臺(tái)開(kāi)發(fā)的解決方案及核心技術(shù)要點(diǎn)。該平臺(tái)已經(jīng)投入商務(wù)英語(yǔ)專(zhuān)業(yè)教師的教學(xué)活動(dòng)當(dāng)中,獲得了師生們的好評(píng),他們一致認(rèn)為該平臺(tái)為學(xué)生利用課外零碎時(shí)間學(xué)習(xí)提供了有力工具,豐富了學(xué)生的自主自我學(xué)習(xí)方式,也提高了教師教育教學(xué)的質(zhì)量。
[參考文獻(xiàn)]
[1]胡延峰,程濤.寬帶增值服務(wù)——語(yǔ)音上網(wǎng)[J].有線(xiàn)電視技術(shù),2004,165(21):58-60,33.
[2]邢敬宏,趙雙萍,劉軍.基于Web的TTS應(yīng)用編程實(shí)現(xiàn)[J].甘肅科技,2007,23(3):78-80.
[3]張海峰,趙凱,陸倜.輕量級(jí)認(rèn)證與授權(quán)研究綜述[J].計(jì)算機(jī)工程,2003,29(1):168-170,198.
[4]高毅,崔向平.淺析移動(dòng)學(xué)習(xí)的特征及應(yīng)用模式[J].絲綢之路,2009,169(24):104-106.
[5]Lauren Darcey,Shane Conder.Android移動(dòng)開(kāi)發(fā)一本就夠[M].北京:人民郵電出版社,2011.
[6]涂惠燕,陳一寧.基于語(yǔ)音識(shí)別和手機(jī)平臺(tái)的英語(yǔ)口語(yǔ)發(fā)音學(xué)習(xí)系統(tǒng)[J].計(jì)算機(jī)應(yīng)用與軟件,2011,28(9):64-66,147.