亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        通用語音合成播放組件

        2014-04-29 00:00:00丁瑞琦
        計算機光盤軟件與應(yīng)用 2014年13期

        摘 要:針對現(xiàn)有煤礦監(jiān)控系統(tǒng)類軟件不支持語音指引、互動回饋等功能,設(shè)計了一款支持Form和Web為前端的語音合成組件,該軟件以組件化形式運行,能夠很好地解決以上的問題,具有很高的實用性和可重用性。

        關(guān)鍵詞:語音合成;TTS;音頻流播放

        中圖分類號:TP391.42

        1 引言

        1.1 簡介

        語音合成又名文句轉(zhuǎn)語音(Text-To-Speech,TTS),它是指將輸入的文字或儲存于電腦中的文件模擬人聲發(fā)出語音的技術(shù)。語音合成較語音辨識的發(fā)展早了許多,但應(yīng)用層面大多仍在閱讀電腦屏幕上的文章,語音指引,互動回饋或輔助說明。

        1.2 相關(guān)技術(shù)介紹

        語音合成技術(shù)示意圖如圖1所示:

        圖1

        語音合成主要是將一段文字進行分析,通過對文字的文句分析、產(chǎn)生韻律、合成單元等一系列操作后,將該段文字轉(zhuǎn)換為以音素組合的形式,再對其進行重組后生成波形,最后形成我們能聽到的聲音。

        目前語音合成產(chǎn)品很多,但所有的語音合成的技術(shù)都差不多,總的來說,語音引擎可以劃分為4個模組:

        (1)文句分析。分析文句的語法與語義后專程語言特征參數(shù),讓電腦知道本文中哪些是詞,哪些是句子,發(fā)什么音,怎么發(fā)音,發(fā)音時到哪應(yīng)該停頓,停頓多長等等。

        (2)韻律產(chǎn)生器。將語言特征參數(shù)送入韻律產(chǎn)生器來產(chǎn)生文句的每個音節(jié)對應(yīng)韻律信息,包含基頻軌跡,音量,音長等。

        (3)合成單元產(chǎn)生器。根據(jù)語音資料庫中的單音節(jié)音素語音波形樣本輸出合成單元。這里就是我們通常理解的語音庫,一個引擎往往可以提供多個語音庫。

        (4)語音合成器。根據(jù)需要發(fā)的音從聲音資料庫中選擇出合適的聲學(xué)參數(shù),然后根據(jù)在韻律模型中得到的韻律參數(shù),透過語音合成演算法產(chǎn)生語音。

        1.3 SAPI技術(shù)

        TTS系統(tǒng)使用合成語音合成文本字符串和文件到聲音音頻流,這個工作是通過各種語音引擎來完成的。語音引擎的開發(fā)難度大,一般都是利用現(xiàn)有的引擎來開發(fā)TTS系統(tǒng),微軟所提供的SAPI(全稱The Microsoft Speech API),正是在應(yīng)用程序和語音引擎之間提供一個高級別的接口,它實現(xiàn)了所有必需的對各種語音引擎的實時的控制和管理等低級別的細節(jié)。

        語音引擎通過DDI層(設(shè)備驅(qū)動接口)和SAPI進行交互,應(yīng)用程序通過API層和SAPI通信。通過使用這些API,我們可以快速開發(fā)在語音識別或語音合成方面應(yīng)用程序。SAPI應(yīng)用程序編程接口(API)明顯的減少了構(gòu)建一個使用語音識別和文本語音轉(zhuǎn)換的應(yīng)用程序所需要的高層代碼,使語音技術(shù)更加容易使用并且更加擴大了應(yīng)用的范圍。

        SAPI 本身并不能做任何事情,只提供了一系列接口,處于應(yīng)用軟件與語音引擎之間,隔離了應(yīng)用軟件與語音引擎之間的聯(lián)系,使得語音引擎的更換不會影響到原有應(yīng)用程序的運行。

        2 系統(tǒng)設(shè)計及框圖

        2.1 系統(tǒng)組成

        語音合成播放組件包括一個語音合成處理服務(wù)、語音播放控制ActiveX控件。

        2.2 產(chǎn)品原理

        圖2

        語音合成服務(wù)器是用來安裝語音合成處理服務(wù)的主機,所有的客戶端發(fā)來的語音合成請求都將在這里處理,這里涉及到一個多路并發(fā)的問題。

        語音合成處理服務(wù)在接收到語音合成的請求后,調(diào)用語音引擎產(chǎn)生了相應(yīng)的語音波形文件或是語音流(Steam),然后把這些指定的輸出對象返回給客戶端請求對象(ActiveX對象),控件和服務(wù)器之間的傳輸方式通過最基本的SOCKET技術(shù),采用TCP協(xié)議傳輸協(xié)議。

        客戶端的ActiveX控件通過SOCKET向服務(wù)器發(fā)送語音合成的請求后,等待服務(wù)器的輸出響應(yīng),得到后,根據(jù)WAV語音編碼規(guī)則進行解碼,并調(diào)用本地的播放接口(Windows API)來播放語音。至此完成整個語音合成播放功能。

        對于不同的客戶端運行環(huán)境,客戶端的ActiveX控件有不同的加載方式。

        (1)Form方式客戶端。有兩種方案可選:

        1)在客戶機上安裝相應(yīng)的環(huán)境和語音引擎,這樣的話就可以直接在客戶端上進行語音合成,而不需要直接從服務(wù)器上取得合成數(shù)據(jù)。優(yōu)勢是快捷,穩(wěn)定,編程方便。缺點是對客戶端安裝的軟件需求較高,不太符合實際。

        2)調(diào)用ActiveX控件對象,進行網(wǎng)絡(luò)語音合成。優(yōu)勢是代碼統(tǒng)一,維護方便。缺點是編程復(fù)雜。

        (2)Web方式客戶端。這種類型可以在客戶瀏覽的語音合成網(wǎng)頁內(nèi)通過JavaScript腳本加入對控件的引用,并通過腳本來調(diào)用控件提供的各種接口,從而實現(xiàn)相應(yīng)的功能。

        3 結(jié)束語

        系統(tǒng)開發(fā)完成后,筆者將該系統(tǒng)應(yīng)用于實際的礦壓監(jiān)控系統(tǒng)中,軟件運行效果良好,能夠在任意IE瀏覽器上正常語音合成報警文字信息。

        語音合成播放組件的實現(xiàn)提高了系統(tǒng)的友好性,讓用戶能夠得到更好的體驗,為今后的語音合成和語音識別提供了參考和借鑒。

        參考文獻:

        [1](美)海杰爾斯伯格,(美)韋爾特馬瑟,(美)戈爾德.韓江,王秀慧,譯.C#編程語言詳解(第2版),2007.

        [2]李禹材,左友東,鄭秀清.基于Speech SDK的語音控制應(yīng)用程序的設(shè)計與實現(xiàn)[J].計算機應(yīng)用,2004(06).

        作者簡介:丁瑞琦(1981-),男,江蘇常州人,碩士研究生,現(xiàn)主要從事煤礦監(jiān)測類軟件設(shè)計與研發(fā)工作。

        作者單位:天地(常州)自動化股份有限公司,江蘇常州 213000

        基金項目:基于GIS的圖形展示組件(項目編號:14SY001-02)。

        亚洲欧洲日产国码久在线观看 | 亚洲成av人在线播放无码| 午夜无码片在线观看影视| 91网站在线看| 色偷偷av一区二区三区人妖| 青青操视频手机在线免费观看| 视频在线观看一区二区三区| 亚洲成a人片在线观看无码3d| 国产三级在线观看播放视频| 亚洲乱码国产乱码精品精| 国内精品久久久久影院一蜜桃| 日日摸日日碰人妻无码老牲| 国产亚洲精品综合99久久| 蜜桃av中文字幕在线观看| 精品偷自拍另类在线观看| 无遮无挡爽爽免费毛片| 国产亚洲AV无码一区二区二三区| 久久精品国产亚洲av蜜桃av| 日本一区二区三级在线| 日日噜噜夜夜狠狠va视频v| 色婷婷综合久久久久中文| AV无码免费不卡在线观看| 日韩精品一区二区三区av| 日本高清一级二级三级| 欧美丰满熟妇xxxx性| 精品国产免费Av无码久久久| 久久精品这里就是精品| 亚洲视频在线免费不卡| 六月丁香综合在线视频| 国产精品户露av在线户外直播| 米奇亚洲国产精品思久久| 开心五月骚婷婷综合网| 乱码1乱码2美美哒| 中国一 片免费观看| 亚洲无码美韩综合| 日本免费看片一区二区三区| 国产综合色在线视频区| 理论片87福利理论电影| AV在线毛片| 精品一级一片内射播放| 在线看片免费人成视频电影|