亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        通用語音合成播放組件

        2014-04-29 00:00:00丁瑞琦
        計算機光盤軟件與應(yīng)用 2014年13期

        摘 要:針對現(xiàn)有煤礦監(jiān)控系統(tǒng)類軟件不支持語音指引、互動回饋等功能,設(shè)計了一款支持Form和Web為前端的語音合成組件,該軟件以組件化形式運行,能夠很好地解決以上的問題,具有很高的實用性和可重用性。

        關(guān)鍵詞:語音合成;TTS;音頻流播放

        中圖分類號:TP391.42

        1 引言

        1.1 簡介

        語音合成又名文句轉(zhuǎn)語音(Text-To-Speech,TTS),它是指將輸入的文字或儲存于電腦中的文件模擬人聲發(fā)出語音的技術(shù)。語音合成較語音辨識的發(fā)展早了許多,但應(yīng)用層面大多仍在閱讀電腦屏幕上的文章,語音指引,互動回饋或輔助說明。

        1.2 相關(guān)技術(shù)介紹

        語音合成技術(shù)示意圖如圖1所示:

        圖1

        語音合成主要是將一段文字進行分析,通過對文字的文句分析、產(chǎn)生韻律、合成單元等一系列操作后,將該段文字轉(zhuǎn)換為以音素組合的形式,再對其進行重組后生成波形,最后形成我們能聽到的聲音。

        目前語音合成產(chǎn)品很多,但所有的語音合成的技術(shù)都差不多,總的來說,語音引擎可以劃分為4個模組:

        (1)文句分析。分析文句的語法與語義后專程語言特征參數(shù),讓電腦知道本文中哪些是詞,哪些是句子,發(fā)什么音,怎么發(fā)音,發(fā)音時到哪應(yīng)該停頓,停頓多長等等。

        (2)韻律產(chǎn)生器。將語言特征參數(shù)送入韻律產(chǎn)生器來產(chǎn)生文句的每個音節(jié)對應(yīng)韻律信息,包含基頻軌跡,音量,音長等。

        (3)合成單元產(chǎn)生器。根據(jù)語音資料庫中的單音節(jié)音素語音波形樣本輸出合成單元。這里就是我們通常理解的語音庫,一個引擎往往可以提供多個語音庫。

        (4)語音合成器。根據(jù)需要發(fā)的音從聲音資料庫中選擇出合適的聲學(xué)參數(shù),然后根據(jù)在韻律模型中得到的韻律參數(shù),透過語音合成演算法產(chǎn)生語音。

        1.3 SAPI技術(shù)

        TTS系統(tǒng)使用合成語音合成文本字符串和文件到聲音音頻流,這個工作是通過各種語音引擎來完成的。語音引擎的開發(fā)難度大,一般都是利用現(xiàn)有的引擎來開發(fā)TTS系統(tǒng),微軟所提供的SAPI(全稱The Microsoft Speech API),正是在應(yīng)用程序和語音引擎之間提供一個高級別的接口,它實現(xiàn)了所有必需的對各種語音引擎的實時的控制和管理等低級別的細節(jié)。

        語音引擎通過DDI層(設(shè)備驅(qū)動接口)和SAPI進行交互,應(yīng)用程序通過API層和SAPI通信。通過使用這些API,我們可以快速開發(fā)在語音識別或語音合成方面應(yīng)用程序。SAPI應(yīng)用程序編程接口(API)明顯的減少了構(gòu)建一個使用語音識別和文本語音轉(zhuǎn)換的應(yīng)用程序所需要的高層代碼,使語音技術(shù)更加容易使用并且更加擴大了應(yīng)用的范圍。

        SAPI 本身并不能做任何事情,只提供了一系列接口,處于應(yīng)用軟件與語音引擎之間,隔離了應(yīng)用軟件與語音引擎之間的聯(lián)系,使得語音引擎的更換不會影響到原有應(yīng)用程序的運行。

        2 系統(tǒng)設(shè)計及框圖

        2.1 系統(tǒng)組成

        語音合成播放組件包括一個語音合成處理服務(wù)、語音播放控制ActiveX控件。

        2.2 產(chǎn)品原理

        圖2

        語音合成服務(wù)器是用來安裝語音合成處理服務(wù)的主機,所有的客戶端發(fā)來的語音合成請求都將在這里處理,這里涉及到一個多路并發(fā)的問題。

        語音合成處理服務(wù)在接收到語音合成的請求后,調(diào)用語音引擎產(chǎn)生了相應(yīng)的語音波形文件或是語音流(Steam),然后把這些指定的輸出對象返回給客戶端請求對象(ActiveX對象),控件和服務(wù)器之間的傳輸方式通過最基本的SOCKET技術(shù),采用TCP協(xié)議傳輸協(xié)議。

        客戶端的ActiveX控件通過SOCKET向服務(wù)器發(fā)送語音合成的請求后,等待服務(wù)器的輸出響應(yīng),得到后,根據(jù)WAV語音編碼規(guī)則進行解碼,并調(diào)用本地的播放接口(Windows API)來播放語音。至此完成整個語音合成播放功能。

        對于不同的客戶端運行環(huán)境,客戶端的ActiveX控件有不同的加載方式。

        (1)Form方式客戶端。有兩種方案可選:

        1)在客戶機上安裝相應(yīng)的環(huán)境和語音引擎,這樣的話就可以直接在客戶端上進行語音合成,而不需要直接從服務(wù)器上取得合成數(shù)據(jù)。優(yōu)勢是快捷,穩(wěn)定,編程方便。缺點是對客戶端安裝的軟件需求較高,不太符合實際。

        2)調(diào)用ActiveX控件對象,進行網(wǎng)絡(luò)語音合成。優(yōu)勢是代碼統(tǒng)一,維護方便。缺點是編程復(fù)雜。

        (2)Web方式客戶端。這種類型可以在客戶瀏覽的語音合成網(wǎng)頁內(nèi)通過JavaScript腳本加入對控件的引用,并通過腳本來調(diào)用控件提供的各種接口,從而實現(xiàn)相應(yīng)的功能。

        3 結(jié)束語

        系統(tǒng)開發(fā)完成后,筆者將該系統(tǒng)應(yīng)用于實際的礦壓監(jiān)控系統(tǒng)中,軟件運行效果良好,能夠在任意IE瀏覽器上正常語音合成報警文字信息。

        語音合成播放組件的實現(xiàn)提高了系統(tǒng)的友好性,讓用戶能夠得到更好的體驗,為今后的語音合成和語音識別提供了參考和借鑒。

        參考文獻:

        [1](美)海杰爾斯伯格,(美)韋爾特馬瑟,(美)戈爾德.韓江,王秀慧,譯.C#編程語言詳解(第2版),2007.

        [2]李禹材,左友東,鄭秀清.基于Speech SDK的語音控制應(yīng)用程序的設(shè)計與實現(xiàn)[J].計算機應(yīng)用,2004(06).

        作者簡介:丁瑞琦(1981-),男,江蘇常州人,碩士研究生,現(xiàn)主要從事煤礦監(jiān)測類軟件設(shè)計與研發(fā)工作。

        作者單位:天地(常州)自動化股份有限公司,江蘇常州 213000

        基金項目:基于GIS的圖形展示組件(項目編號:14SY001-02)。

        偷柏自拍亚洲综合在线| 老头巨大挺进莹莹的体内免费视频| 日夜啪啪一区二区三区| 国产3p视频| 手机av男人天堂免费网址| 男人天堂亚洲天堂av| 人妻体内射精一区二区三四| 国产乱沈阳女人高潮乱叫老| 国产精品无码久久AⅤ人妖| 国产三级精品和三级男人| 777米奇色狠狠俺去啦| 八区精品色欲人妻综合网| 日本熟妇中文字幕三级| 亚洲天堂av一区二区| 日本真人做爰免费视频120秒| 蜜臀av 国内精品久久久| 久久99国产伦精品免费| av手机天堂在线观看| 曰批免费视频播放免费| 久久综合九色综合网站| 偷拍网日本一区二区三区| 久久成人精品国产免费网站| 国产成人精品久久亚洲高清不卡 | 风韵人妻丰满熟妇老熟| 国产日产欧洲系列| 99在线精品国产不卡在线观看 | 日本三级香港三级人妇99| 亚洲一线二线三线写真| 久久亚洲精品无码va白人极品| 乱码一二三入区口| 蜜桃av无码免费看永久 | 日本一区二区三区爱爱视频| 国产精品久久久久9999| 精品久久久久久无码国产| 超级少妇一区二区三区| 日韩亚洲一区二区三区四区| 亚洲男人av天堂午夜在| 精品视频专区| 国产激情一区二区三区不卡av| 99无码精品二区在线视频 | 极品熟妇大蝴蝶20p|