摘要:將計算機語音合成技術(shù)應用到計算機輔助教學CAI中,對教學能提供較大幫助??梢岳脤iT的語音合成軟件TTS App進行語音合成,也可以利用Microsoft Office XP中的Excel提供的語音合成功能,通過設(shè)置,在Word和PowerPoint中實現(xiàn)語音合成。
關(guān)鍵詞:語音合成;CAI;TTS App;Office XP
引言
計算機語音合成即TTS(Text to Speech),指計算機將隨機產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)槿丝梢月牰摹⑤^流利的口語輸出。語音合成是計算機應用的重要領(lǐng)域,其研究涉及到計算機科學、語言學、語音學、人工智能、心理學等多種學科。
實現(xiàn)計算機語音輸出一般有兩種方法:一種是錄音/重放,另一種是文字—語音轉(zhuǎn)換。錄音/重放方法是原語音的重現(xiàn),可獲得高質(zhì)量的聲音,但它不能滿足實時修改發(fā)音內(nèi)容的需要,而且所需的存儲容量會隨發(fā)音時間而線性增長。文字—語音轉(zhuǎn)換方法可以根據(jù)給定文字即時發(fā)出語音,文語轉(zhuǎn)換的參數(shù)庫不會隨發(fā)音時間增長而加大,但是要尋找合適的參數(shù)和生成算法,并合成極似人類發(fā)音的、自然流暢的語音難度非常大。
一般來說,錄音/重放技術(shù)常應用于一些不需要語言理解和隨時更新的系統(tǒng)中,如航班信息發(fā)布、語音報時、汽車報站、電話語音服務等系統(tǒng)。而文字—語音轉(zhuǎn)換系統(tǒng)是基于語音合成技術(shù)實現(xiàn)的文字到語音的即時轉(zhuǎn)換,能適應各種需求,應用領(lǐng)域極為廣泛。
1 計算機輔助教學CAI中的語音合成
隨著現(xiàn)代教育技術(shù)水平的提高,以及各院校多媒體教學設(shè)備的更新,許多教師都采用了CAI技術(shù)和多媒體教學手段,其中不可避免地要碰到輸出語音的問題,比如在利用PowerPoint電子演示文稿軟件放映幻燈片時,有時就需要輸出語音。利用PowerPoint自帶的“錄制旁白”的方法,將教師的語音保存在計算機中,放映時同步播出,這樣做雖然語音質(zhì)量較好,但是一則錄制旁白比較麻煩,花費時間較長,對錄音時的環(huán)境要求較高,二則需要較大的存儲空間,不利于課件的轉(zhuǎn)送,三是內(nèi)容不能更新。另外,有些課程,如《計算機專業(yè)英語》,其中許多內(nèi)容并沒有配備相應語音文件,單獨找外教錄制也很麻煩。
因而,將計算機語音合成技術(shù)應用到多媒體教學中,讓計算機自己按照教師的要求即時“讀”出語音,是非常有意義的。
2 語音合成應用于CAI中的實現(xiàn)技術(shù)
要在CAI中實現(xiàn)語音合成,可以采取直接調(diào)用TTS軟件合成語音的方法,也可以在CAI課件中嵌入語音。TTS軟件可以將輸入文本后直接轉(zhuǎn)換成語音輸出,而且可以控制語音的語速、音量、暫停、繼續(xù)播放等,操作簡便。在課件中嵌入語音,可以利用Microsoft Office XP自帶的語音合成引擎,經(jīng)過簡單設(shè)置后實現(xiàn)指定內(nèi)容的語音輸出。
2.1 利用TTS軟件直接輸出語音
自20世紀60年代首個英語TTS系統(tǒng)研制成功以來,迄今世界上已推出多種語言的TTS系統(tǒng)。近年來我國也研制出許多優(yōu)秀的漢語TTS軟件,都較好地實現(xiàn)了輸入語篇后立時轉(zhuǎn)換成語音的任務,而且這些系統(tǒng)合成的漢語語音的可懂度、清晰度都達到了較高的水平。
在這樣的軟件環(huán)境下,教師可以直接利用現(xiàn)成的TTS軟件實現(xiàn)語音輸出。這里以Microsoft Speech SDK中的TTs App軟件的操作為例作一介紹。
首先在網(wǎng)絡瀏覽器IE的地址欄中輸入網(wǎng)址:http://www.microsofl.corn/downloads/details.a(chǎn)spx?Familyld=5E86EC97-40A7-453F-BOEE-658317184530displaylang=en 在該Microsoft Speech SDK 5.1下載頁面上找到“Files inThis Download\"部分,如圖1所示。這部分包括了幾個獨立的供下載的文件。其中SpeechSDK51.exe文件提供了英語語音引擎,SpeechSDK51LangPack.exe文件提供了漢語語音引擎。
下載完成后,首先雙擊運行SpeechSDK51.exe進行解壓,解壓完成后雙擊運行解壓出的Setup.exe安裝文件,按照安裝向?qū)崾景惭bMicrosoft Speech SDK 5.1。該文件安裝完成后,再雙擊SpeechSDK51LangPack.exe自解壓文件,解壓后將在當前目錄下生成一個名為LangPack的文件夾,在該文件夾中找到Setup.exe安裝文件,雙擊運行,按照安裝向?qū)У奶崾具M行“Complete”安全安裝。
安裝完成后,在[開始]菜單的[所有程序]下會發(fā)現(xiàn)一個[Microsoft Speech SDK 5.1]程序組圖標,在其下級菜單中找到[Tool]菜單頃,其中有—個[TTs App]命令,單擊,即可運行該軟件。
在“Enter text you wish spoken here.(在此輸入你想朗讀的文本)”文本輸入框中,輸入需要語音輸出的文本內(nèi)容,單擊右邊的“Speak”按鈕,就可以聽到計算機合成的語音輸出了。
用戶可以通過“Voice”下拉式列表框來選擇英文語音發(fā)音(分男女聲)或中文語音發(fā)音(男聲),并可通過“Rate”滑尺來選擇語音的音速,通過“Volume”來調(diào)節(jié)語音的音量高低,通過“Format”下拉式列表框來選擇聲音的格式。另外還可以通過右側(cè)的“Pause”、“Speak”按鈕來控制輸出語音的輸出和繼續(xù)播放等。
利用Microsoft Speech SDK這個TTS軟件來進行計算機語音合成,因為需要在教師機上下載相應的軟件并進行安裝,另外輸入的文本篇幅受限小且不能保存,所以使用上有局限性。
2.2 在Microsoft Office XP中實現(xiàn)語音輸出
現(xiàn)在多數(shù)教師所用的計算機都安裝了Microsoft OfficeXP辦公軟件。Microsoft Office XP比起Microsoft Office以前的版本來說,增加了許多新功能,其中包括語音合成功能。
2.2.1 Excel語音合成功能介紹
啟動Excel(本文中所提到的Word、Excel和PowerPoint指的都是Microsoft Office XP中的成員),單擊[工具]菜單下的[語音]菜單項,在下級菜單中選中[顯示“文本到語音”工具欄]復選項,即出現(xiàn)“文本到語音”工具欄。
“文本到語音”32具欄中的按鈕從左到右依次為“朗讀單元格”、“停止朗讀”、“按行”、“按列”和“按回車鍵開始朗讀”。
當用戶在單元格中輸入要合成語音輸出的文本內(nèi)容后,選中單元格,單擊“文本到語音”工具欄中的“朗讀單元格”按鈕,就可以聽到計算機合成的語音輸出了。
這里需要說明的是,通過選擇“控制面板”下的“聲音、語音和音頻設(shè)備”項目,選擇其中的“語音”圖標,在彈出的“語音屬性”對話框中有一“語音選擇”下拉式列表框,如圖2所示,通過選擇“Microsoft Sam”(英文男聲朗讀)或“Microsoft SimplifiedChinese”(簡體中文男聲朗讀),可以分別實現(xiàn)英文語音輸出和中文語音輸出。此外,還可以對輸出語音的速度進行調(diào)整。
2.2.2在Word中實觀語音合成
啟動Word,單擊[工具]菜單下的[宏],在彈出的下級菜單中選擇[宏…]菜單項。在彈出的“宏”對話框中的“宏名”文本輸入框中輸入宏的名稱,例如“WordTTS”,單擊“創(chuàng)建”按鈕。在彈出的Microsoft Visual Basic中的代碼輸入窗口中,輸入以下代碼:
Sub WordTTS
Call Excel.Application.Speech.Speak(Selection)
End Sub
輸入完成后,再單擊[工具]菜單下的[引用]菜單項,在彈出的“引用”對話框中的“可使用的引用”列表框中,找到并選中“Microsoft Excel 10.0 Object Library”復選框,單擊“確定”按鈕,并保存,關(guān)閉Microsoft Visual Basic窗口,回到Word編輯窗口。
在Word的文檔中輸入文字,例如:
“How to select a personal computer system?1 will tell you
something about that.”
隨后選中這段文字,再單擊[工具]菜單中的[宏],選擇[宏]菜單項,在彈出的“宏”對話框中選中“WordTTS”宏名,單擊“運行”按鈕,就可以聽到計算機讀出的語音了。
這樣,當我們需要在Word中進行語音合成時,只要選定需要輸出語音的文本內(nèi)容,再運行剛才的宏WordTTS,就可以隨時得到合成語音了。
2.2.3在PowerPoint中實現(xiàn)話音合成
在Word中我們實現(xiàn)了利用計算機語音合成來進行CAI的語音輸出。但是在實際教學中,大多數(shù)教師在教學過程中使用了Microsoft Office XP中的PowerPoint電子演示文稿軟件來制作多媒體課件。我們也可以利用Microsoft Office XP的語音合成功能實現(xiàn)PowerPoint電子演示文稿中的語音輸出,使語音合成功能更具實用性。
首先啟動PowerPoint,在出現(xiàn)的新建演示文稿的第—張幻燈片中,單擊標題文本框(也即第—個文本框),輸入—段文字,例如:
“How to select a personal computer system?I will tell you
something about that.”
單擊[32具]菜單下的[宏],在彈出的下級菜單中選擇[宏…]菜單項。在彈出的“宏”對話框中的“宏名”文本輸入框中輸入宏的名稱,例如“PPTTTS”,單擊“創(chuàng)建”按鈕。在彈出的Microsoft Visual Basic編輯器中,單擊[工具]菜單下的[引用]菜單項,在彈出的“引用”對話框中的“可使用的引用”列表框中,找到并選中“Microsoft Excel 10.0 Object Library\"復選框,單擊“確定”按鈕。接著,在代碼輸入窗口中,輸入以下代碼:
單擊[幻燈片放映]菜單中的[動作按鈕]菜單項,在列出的十二種動作按鈕中任選一種動作按鈕。雙擊幻燈片的右下角,將動作按鈕插入到幻燈片中。在隨即彈出的“動作設(shè)置”對話框中,選擇“單擊鼠標”選項卡,將“單擊鼠標時的動作”設(shè)為“運行宏”,并在“運行宏”下方的下拉式列表框中選定剛才所創(chuàng)建的\"PPTTTS\"宏名,單擊“確定”按鈕。這樣在幻燈片中就出現(xiàn)了一個動作按鈕,如圖3所示。
最后,單擊[幻燈片放映]菜單下的[觀看放映],進入幻燈片放映的界面中,再單擊動作按鈕,就可以聽到對這第一張幻燈片的第一個文本框中的內(nèi)容的語音朗讀了。
該過程的代碼中的\"Call Excel.Application.Speech.Speak.(PowerPoint.ActivePresentation.Slides(1).Shapes(1).TextFrame.TextRange.Text)\"語句,是對PowerPoint當前電子演示文稿中的第1張幻燈片的第1個對象文本框中的文本內(nèi)容進行語音輸出。當用戶插入新的幻燈片時,只需對相應的代碼加以修改即可。
3 結(jié)束語
計算機語音合成在計算機輔助教學CAI中具有很大的作用。教師可以通過專門的TTS軟件實現(xiàn)語音輸出,也可以在Microsoft Office XP中實現(xiàn)語音輸出。利用本文中所述方法,教師只需通過簡單的語句設(shè)置和操作,即可完成CAI課件中的語音合成。
但是不管用何種方法實現(xiàn)語音輸出,都存在計算機合成語音的質(zhì)量問題。合成語音的質(zhì)量取決于語音合成引擎的質(zhì)量。計算機語音合成的質(zhì)量不夠高、自然度和流暢度不夠好等,是語音合成研究領(lǐng)域仍在努力攻克的難題。隨著計算機語音合成技術(shù)的發(fā)展,合成語音的質(zhì)量、自然度和情感表現(xiàn)力將會不斷地提高。相信在不久的將來,合成語音能像人類發(fā)音一樣自然流暢。